Alibaba презентувала сімейство гібридних мовних моделей Qwen3

Alibaba представила сімейство гібридних ШІ-моделей Qwen3

Компанія Alibaba офіційно представила нове сімейство великих мовних моделей (LLM) під назвою Qwen3, які охоплюють архітектури від 0,6 до 235 мільярдів параметрів. Новий ряд моделей створений для досягнення високих показників у різних сферах застосування штучного інтелекту (ШІ), демонструючи результати, що конкурують або перевищують показники відомих світових лідерів, таких як OpenAI та Google.

Про це розповідає UBB

Особливості та доступність моделей Qwen3

Більшість моделей серії Qwen3 поширюються під відкритою ліцензією і розміщені на популярних платформах Hugging Face та GitHub. Вони здатні працювати у гібридному режимі, що дозволяє одночасно виконувати прості запити та глибокі обчислювальні завдання, оптимізуючи використання ресурсів. За словами представників Alibaba, обсяг навчальних даних для створення моделей склав майже 36 трильйонів токенів, включаючи різноманітні джерела — від навчальних матеріалів та коду до питань-відповідей та синтетичних даних.

Результати тестувань та майбутні плани

За результатами тестів на платформах Codeforces та AIME, найбільша модель Qwen3 перевершила популярні рішення o3-mini від openai та Gemini 2.5 Pro від Google. Однак, поки що версія з 235 мільярдами параметрів ще не вийшла у реліз, і на ринку найпопулярнішою залишається модель Qwen3-32B, яка демонструє переваги у низці кодингових бенчмарків, перевищуючи аналогічні моделі від openai.

Моделі Qwen3 вже доступні через хмарні платформи Fireworks AI та Hyperbolic. Експерти вважають, що, незважаючи на обмеження щодо експорту, китайські розробники ШІ активно конкурують на світовому ринку та підсилюють свою позицію у глобальній галузі, наближаючись до рівня західних лідерів.

Раніше компанія openai презентувала нові моделі o3 та o4-mini, які претендують стати найпотужнішими у своїй історії. За словами представників, ці моделі здатні самостійно використовувати інструменти ChatGPT для виконання складних завдань, що включає пошук в інтернеті, аналіз зображень, обробку файлів і написання коду.