Чому OpenAI обмежила згадки міфічних істот у ChatGPT?

чому OpenAI заборонила ChatGPT згадувати міфічних істот?
  • Компанія зафіксувала різке зростання згадок «гоблінів» і «гремлінів».
  • Проблема виникла після запуску моделі GPT-5.1.
  • Розробники пов’язали збій з особливостями навчання «особистості» ШІ.

Компанія OpenAI була змушена внести корективи у роботу своїх ШІ-моделей через несподівану проблему в ChatGPT. Користувачі та співробітники помітили, що система почала частіше згадувати міфологічних істот, зокрема гоблінів і гремлінів, навіть у абсолютно нерелевантних контекстах.

Про це розповідає UBB

В офіційному блозі OpenAI зазначено, що частота згадування слова «гоблін» зросла приблизно на 175% після запуску моделі GPT-5.1, а «гремлін» — на 52%. Хоча такі згадки раніше траплялися рідко, їхнє зростання стало помітним і призвело до внутрішнього розслідування.

Зростання згадок «гоблінів» у відповідях ChatGPT залежно від типу «особистості» моделі. Дані: OpenAI.
Зростання згадок «гоблінів» у відповідях ChatGPT залежно від типу «особистості» моделі. Дані: OpenAI.

Збій в «особистості» моделі

Розробники виявили, що проблема пов’язана з налаштуванням «характеру» моделі. Під час навчання більш дружньому та розмовному стилю система почала використовувати образи на кшталт гоблінів та інших істот як метафори. Це призвело до їхньої надмірної появи у відповідях.

В результаті OpenAI впровадила нові обмеження для своїх інструментів, зокрема кодового асистента Codex. В інструкціях зазначено уникати згадок гоблінів, гремлінів, єнотів, тролів та інших істот, якщо це не пов’язано безпосередньо із запитом користувача.

Приклад відповіді ChatGPT, де замість єдинорога модель згенерувала ASCII-гобліна. Дані: OpenAI.
Приклад відповіді ChatGPT, де замість єдинорога модель згенерувала ASCII-гобліна. Дані: OpenAI.

Компанія підкреслила, що це не маркетинговий хід, а спроба усунути побічний ефект навчання. За оцінками розробників, близько 66,7% згадок «гоблінів» були пов’язані саме з цим «особистісним» режимом моделі.

Інцидент став прикладом ширшої проблеми в індустрії штучного інтелекту. Йдеться про те, що прагнення зробити чат-ботів більш «живими» може знижувати точність і підвищувати ймовірність помилок. Експерти зазначають, що подібні поведінкові збої можуть закріплюватися в моделі, якщо не контролювати процес навчання.

Раніше аналогічні випадки вже викликали резонанс, коли чат-боти давали дивні або некоректні поради, наприклад, рекомендували «їсти каміння» або використовувати клей у кулінарії.

Нагадаємо, що Ілон Маск заявив про загрозу сценарію «Термінатора» для людства.