OpenAI презентувала GPT-5.5: нові можливості та план на ШІ-суперапп

OpenAI випустила GPT-5.5 та наблизилася до ідеї ШІ-супераппа
  • Нова модель покращила результати в програмуванні, наукових завданнях і роботі з інструментами.
  • У компанії вважають реліз кроком до об’єднання ChatGPT, Codex й браузера в єдиний сервіс.
  • GPT-5.5 вже доступна підписникам, а API обіцяють відкрити найближчим часом.

Компанія OpenAI представила нову модель GPT-5.5, яку називають найрозумнішою та найінтуїтивнішою в її лінійці. За словами розробників, новинка покращила швидкість розуміння запитів користувача та зменшила використання токенів для виконання тих самих завдань.

Про це розповідає UBB

Модель здатна виконувати складні завдання на комп’ютері, такі як написання та налагодження коду, аналіз даних, створення документів і перемикання між різними інструментами.

Президент компанії Грег Брокман назвав реліз важливим кроком до “більш агентних та інтуїтивно зрозумілих обчислень”.

За його словами, нова версія також наближає запуск “супераппа” — єдиного сервісу, що об’єднає ChatGPT, Codex і AI Browser. OpenAI сподівається, що така інтеграція дозволить ефективніше виконувати робочі завдання в межах однієї екосистеми.

Ставка на програмування та інтелектуальну роботу

У новій моделі особливу увагу приділено програмуванню.

У тестах Terminal-Bench 2.0 модель отримала 82,7%, а в SWE-Bench Pro — 58,6%. Розробники також заявили, що GPT-5.5 перевершила попередню версію GPT-5.4 у внутрішньому бенчмарку Expert-SWE для складних інженерних завдань з тривалим горизонтом планування.

При цьому поліпшення досягнуто без значного збільшення витрат токенів.

Результати бенчмарків для GPT-5.5. Дані: OpenAI.
Результати бенчмарків для GPT-5.5. Дані: OpenAI.

Зростання продуктивності також зафіксоване в інших сценаріях. Наприклад, у бенчмарку GDPval, що оцінює виконання інтелектуальної роботи в 44 професіях, модель отримала 84,9%, а в OSWorld-Verified, що перевіряє роботу в реальному комп’ютерному середовищі, — 78,7%.

Результати проходження Tau2-bench Telecom для складних сценаріїв клієнтського обслуговування склали 98,0% без додаткового налаштування. Окрім того, компанія зазначила високі результати у фінансовому аналізі, моделюванні та виконанні офісних завдань.

Наукові дослідження та безпека

OpenAI також акцентує увагу на наукових дослідженнях.

У тестах GeneBench, які стосуються аналізу даних у генетиці та кількісній біології, GPT-5.5 показала помітне зростання в порівнянні з GPT-5.4. У BixBench для біоінформатики модель продемонструвала найкращий результат серед систем з опублікованими оцінками.

Розробники вважають, що нова модель здатна прискорити реальну дослідницьку роботу.

Результати тесту Gene Bench для GPT-5.5. Дані: OpenAI.
Результати тесту Gene Bench для GPT-5.5. Дані: OpenAI.

Крім того, розробники посилили заходи безпеки моделі. Для GPT-5.5 вдосконалено контроль за небезпечними запитами, додані нові класифікатори ризиків та розширені заходи проти повторного зловживання.

Можливості моделі в кібербезпеці, а також у біологічній і хімічній сферах оцінюють як “високий рівень”.

GPT-5.5 уже доступна користувачам Plus, Pro, Business і Enterprise через ChatGPT та Codex, а GPT-5.5 Pro — для Pro, Business і Enterprise. API з новою моделлю обіцяють додати найближчим часом. Базова версія коштуватиме $5 за 1 млн вхідних токенів і $30 за 1 млн вихідних, Pro-версія — $30 і $180 відповідно.

Нагадаємо, нещодавно інвестори висловили сумніви стосовно оцінки OpenAI у $852 млрд.