OpenAI пришлось признать ошибку — ChatGPT стал льстить всем подряд


OpenAI пришлось признать ошибку — ChatGPT стал льстить всем подряд

OpenAI официально признала, что поспешила с обновлением GPT-4o, которое сделало ChatGPT чрезмерно «услужливым» и склонным к лести. В блоге компания признала, что игнорировала сигналы от экспертов, указывавших на странности в поведении модели.

Обновление задумывалось как улучшение работы с памятью, пользовательской обратной связью и более актуальными данными. Но в результате ChatGPT стал чрезмерно соглашаться с пользователями — даже в сомнительных или опасных ситуациях.

OpenAI связывает это с тем, что начала использовать оценки «палец вверх/вниз» как дополнительный сигнал вознаграждения — и это ослабило основной механизм, сдерживавший льстивость. В компании признали, что память модели тоже может усиливать подобное поведение.

При этом внутренние офлайн-тесты и A/B-эксперименты показали позитивные результаты — но отдельные эксперты уже тогда указывали, что с моделью «что-то не так».

В OpenAI заявили, что выводы были сделаны: теперь поведенческие отклонения смогут блокировать релиз, а пользователи смогут раньше тестировать обновления в рамках альфа-доступа. Кроме того, компания пообещала заранее предупреждать даже о «незначительных» изменениях в ChatGPT.

Ранее в ChatGPT появилась функция поиска и подбора товаров по запросу пользователя.


Source: https://postium.ru/openai-prishlos-priznat-chatgpt-stal-lstit/

Межтекстовые Отзывы
Посмотреть все комментарии
guest

Память в ChatGPT: что делать если заполнена, как очистить или увеличить

Память в ChatGPT: что делать если заполнена, как очистить или увеличить Представьте, вы начинаете рабочий день, открываете рабочий...

Что такое промт-инжиниринг и кто такие промпт-инженеры — простыми словами

Что такое промт-инжиниринг и кто такие промпт-инженеры — простыми словами Ты даёшь нейросети задание — она пишет банальность....

Этика искусственного интеллекта: философские дилеммы цифровой эпохи

Современная цивилизация переживает беспрецедентную трансформацию, в центре которой находится стремительное развитие искусственного интеллекта. Технологии, которые еще недавно казались...

ИИ-агент Manus AI стал доступен всем — есть бесплатные возможности

ИИ-агент Manus AI стал доступен всем — есть бесплатные возможности Сегодня китайский универсальный ИИ-агент Manus AI официально вышел...

Чат-бот Grok научился создавать PDF-документы — с таблицами, схемами и диаграммами

Чат-бот Grok научился создавать PDF-документы — с таблицами, схемами и диаграммами Компания xAI добавила в веб-версию чат-бота Grok...

YandexART 2.5 и подписка Шедеврум Про — как включить/отключить подписку

YandexART 2.5 и подписка Шедеврум Про — как включить/отключить подписку Яндекс официально представил новую линейку генеративных моделей —...

OpenAI открыла бесплатный доступ к «продвинутому» голосовому режиму ChatGPT

OpenAI открыла бесплатный доступ к «продвинутому» голосовому режиму ChatGPT OpenAI объявила о запуске Advanced Voice Mode на базе...

Qwen представила «думающую» модель QwQ-Max-Preview и режим «Thinking QwQ»

Qwen представила «думающую» модель QwQ-Max-Preview и режим «Thinking QwQ» Команда нейросети Qwen AI анонсировала QwQ-Max-Preview — новую модель...

Meta* и Ray-Ban представили лимитированную серию умных очков

Meta* и Ray-Ban представили лимитированную серию умных очков На Парижской неделе моды состоялся дебют эксклюзивной модели Ray-Ban Meta*...

Исследования от ChatGPT теперь можно скачивать в PDF

Исследования от ChatGPT теперь можно скачивать в PDF Платные пользователи ChatGPT получили удобную функцию: теперь можно сохранять отчёты...

Perplexity AI: что это за нейросеть, как пользоваться на русском языке

Perplexity AI: что это за нейросеть, как пользоваться на русском языке Нейросеть Perplexity AI совмещает в себе функционал...

Xiaomi представила свою «рассуждающую» нейросеть MiMo

Xiaomi представила свою «рассуждающую» нейросеть MiMo Компания Xiaomi впервые выпустила собственную открытую языковую модель — MiMo. В пресс-релизе...

OpenAI запустила ИИ-агента Codex для программирования — он работает в облаке и подключается к GitHub

OpenAI запустила ИИ-агента Codex для программирования — он работает в облаке и подключается к GitHub OpenAI представила автономного...

Adobe добавит ИИ-агентов в Photoshop и Premiere Pro

Adobe добавит ИИ-агентов в Photoshop и Premiere Pro Компания Adobe готовит серьёзное обновление для своих ключевых продуктов —...

Сбер выпустил GigaChat 2.0 — нейросеть стала умнее, быстрее и продуктивнее

Сбер выпустил GigaChat 2.0 — нейросеть стала умнее, быстрее и продуктивнее Сбер официально представил второе поколение своей флагманской...

Нейросети для генерации изображений с надписями – 5 лучших

Нейросети для генерации изображений с надписями – 5 лучших Некоторые нейросети умеют не только генерировать картинки, но и...

Яндекс научил Поиск объяснять сложные задачи по алгебре для старшеклассников

Яндекс научил Поиск объяснять сложные задачи по алгебре для старшеклассников Яндекс продолжает развивать интеллектуальные функции своего Поиска: теперь...

Anthropic научила чат-бот Claude искать в интернете

Anthropic научила чат-бот Claude искать в интернете Чат-бот Claude от Anthropic получил долгожданную функцию веб-поиска — теперь он...

Как сделать куклу в коробке в ChatGPT по фото — в стиле Bratz, Pullip или Blythe

Как сделать куклу в коробке в ChatGPT по фото — в стиле Bratz, Pullip или Blythe Всё началось...

Яндекс представил ИИ-модель YandexGPT 5 Pro и добавил её в чат с Алисой

Яндекс представил ИИ-модель YandexGPT 5 Pro и добавил её в чат с Алисой Яндекс обновил чат с Алисой,...