OpenAI пришлось признать ошибку — ChatGPT стал льстить всем подряд


OpenAI пришлось признать ошибку — ChatGPT стал льстить всем подряд

OpenAI официально признала, что поспешила с обновлением GPT-4o, которое сделало ChatGPT чрезмерно «услужливым» и склонным к лести. В блоге компания признала, что игнорировала сигналы от экспертов, указывавших на странности в поведении модели.

Обновление задумывалось как улучшение работы с памятью, пользовательской обратной связью и более актуальными данными. Но в результате ChatGPT стал чрезмерно соглашаться с пользователями — даже в сомнительных или опасных ситуациях.

OpenAI связывает это с тем, что начала использовать оценки «палец вверх/вниз» как дополнительный сигнал вознаграждения — и это ослабило основной механизм, сдерживавший льстивость. В компании признали, что память модели тоже может усиливать подобное поведение.

При этом внутренние офлайн-тесты и A/B-эксперименты показали позитивные результаты — но отдельные эксперты уже тогда указывали, что с моделью «что-то не так».

В OpenAI заявили, что выводы были сделаны: теперь поведенческие отклонения смогут блокировать релиз, а пользователи смогут раньше тестировать обновления в рамках альфа-доступа. Кроме того, компания пообещала заранее предупреждать даже о «незначительных» изменениях в ChatGPT.

Ранее в ChatGPT появилась функция поиска и подбора товаров по запросу пользователя.


Source: https://postium.ru/openai-prishlos-priznat-chatgpt-stal-lstit/

Межтекстовые Отзывы
Посмотреть все комментарии
guest

KOLORS 2.0 — нейросеть Kling обновила генератор изображений

KOLORS 2.0 — нейросеть Kling обновила генератор изображений Kling AI представили KOLORS 2.0 — мощное обновление генератора изображений,...

Studio Ghibli-style AI от ChatGPT — как пользоваться, обработка фото и создание картинок

Studio Ghibli-style AI от ChatGPT — как пользоваться, обработка фото и создание картинок В марте 2025 года OpenAI...

Яндекс представил ИИ-модель YandexGPT 5 Pro и добавил её в чат с Алисой

Яндекс представил ИИ-модель YandexGPT 5 Pro и добавил её в чат с Алисой Яндекс обновил чат с Алисой,...

Обучение работе с ChatGPT — 10 лучших курсов 2025 года

Обучение работе с ChatGPT — 10 лучших курсов 2025 года ChatGPT — это чат-бот от OpenAI, выпущенный в...

Нейросети для генерации изображений с надписями – 5 лучших

Нейросети для генерации изображений с надписями – 5 лучших Некоторые нейросети умеют не только генерировать картинки, но и...

OpenAI пришлось признать ошибку — ChatGPT стал льстить всем подряд

OpenAI пришлось признать ошибку — ChatGPT стал льстить всем подряд OpenAI официально признала, что поспешила с обновлением GPT-4o,...

Вышел Kling AI 2.0 Master — разбираем, что нового

Вышел Kling AI 2.0 Master — разбираем, что нового Компания Kuaishou объявила о выходе нейросети Kling AI 2.0...

Qwen представила «думающую» модель QwQ-Max-Preview и режим «Thinking QwQ»

Qwen представила «думающую» модель QwQ-Max-Preview и режим «Thinking QwQ» Команда нейросети Qwen AI анонсировала QwQ-Max-Preview — новую модель...

Кто такие AI-тренеры, чем они занимаются и сколько зарабатывают

Кто такие AI-тренеры, чем они занимаются и сколько зарабатывают ИИ — это магия? Не совсем. Нейросети обучают люди....

Исследование: Как бизнес использует нейросети

Исследование: Как бизнес использует нейросети Большинство крупных компаний в России уже внедряют генеративный ИИ — но не разрабатывают...

Авито внедряет нейросети для создания объявлений — A-Vibe и A-Vision

Авито внедряет нейросети для создания объявлений — A-Vibe и A-Vision Авито представила две новые нейросети, которые помогут пользователям...

Perplexity AI: что это за нейросеть, как пользоваться на русском языке

Perplexity AI: что это за нейросеть, как пользоваться на русском языке Нейросеть Perplexity AI совмещает в себе функционал...

OpenAI интегрировала GPT-4.1 в ChatGPT

OpenAI интегрировала GPT-4.1 в ChatGPT 14 апреля 2025 года OpenAI представила GPT-4.1 — новую языковую модель, которая теперь...

Roblox выпустила Cube 3D — нейросеть для генерации 3D-объектов по тексту

Roblox выпустила Cube 3D — нейросеть для генерации 3D-объектов по тексту Roblox представила Cube 3D — свой первый...

Число еженедельных пользователей ChatGPT превысило 400 миллионов

Число еженедельных пользователей ChatGPT превысило 400 миллионов Компания OpenAI сообщила о стремительном росте аудитории ChatGPT: число еженедельных активных...

ИИ-агент Manus AI стал доступен всем — есть бесплатные возможности

ИИ-агент Manus AI стал доступен всем — есть бесплатные возможности Сегодня китайский универсальный ИИ-агент Manus AI официально вышел...

Manus AI: что это за ИИ-агент, что умеет, как получить приглашение

Manus AI: что это за ИИ-агент, что умеет, как получить приглашение Автономные ИИ-ассистенты уже не фантастика, а реальность....

OpenAI представила GPT-4.5

OpenAI представила GPT-4.5 OpenAI официально представила GPT-4.5 — свою самую продвинутую языковую модель. Она стала доступна пользователям ChatGPT...

Baidu представила новые ИИ-модели Ernie X1 и Ernie 4.5

Baidu представила новые ИИ-модели Ernie X1 и Ernie 4.5 Китайский техногигант Baidu усиливает конкуренцию на рынке искусственного интеллекта,...

Компьютерное зрение в медицине: как нейросети революционизируют диагностику и лечение

Современная медицина переживает фундаментальную трансформацию благодаря внедрению технологий искусственного интеллекта. Компьютерное зрение становится одним из ключевых инструментов, способных...