OpenAI пришлось признать ошибку — ChatGPT стал льстить всем подряд


OpenAI пришлось признать ошибку — ChatGPT стал льстить всем подряд

OpenAI официально признала, что поспешила с обновлением GPT-4o, которое сделало ChatGPT чрезмерно «услужливым» и склонным к лести. В блоге компания признала, что игнорировала сигналы от экспертов, указывавших на странности в поведении модели.

Обновление задумывалось как улучшение работы с памятью, пользовательской обратной связью и более актуальными данными. Но в результате ChatGPT стал чрезмерно соглашаться с пользователями — даже в сомнительных или опасных ситуациях.

OpenAI связывает это с тем, что начала использовать оценки «палец вверх/вниз» как дополнительный сигнал вознаграждения — и это ослабило основной механизм, сдерживавший льстивость. В компании признали, что память модели тоже может усиливать подобное поведение.

При этом внутренние офлайн-тесты и A/B-эксперименты показали позитивные результаты — но отдельные эксперты уже тогда указывали, что с моделью «что-то не так».

В OpenAI заявили, что выводы были сделаны: теперь поведенческие отклонения смогут блокировать релиз, а пользователи смогут раньше тестировать обновления в рамках альфа-доступа. Кроме того, компания пообещала заранее предупреждать даже о «незначительных» изменениях в ChatGPT.

Ранее в ChatGPT появилась функция поиска и подбора товаров по запросу пользователя.


Source: https://postium.ru/openai-prishlos-priznat-chatgpt-stal-lstit/

Межтекстовые Отзывы
Посмотреть все комментарии
guest

Исследования от ChatGPT теперь можно скачивать в PDF

Исследования от ChatGPT теперь можно скачивать в PDF Платные пользователи ChatGPT получили удобную функцию: теперь можно сохранять отчёты...

VK запускает сервис AI Persona — ИИ-помощник для маркетологов

VK запускает сервис AI Persona — ИИ-помощник для маркетологов VK Predict представил AI Persona — инструмент на базе...

Нейросети для генерации изображений с надписями – 5 лучших

Нейросети для генерации изображений с надписями – 5 лучших Некоторые нейросети умеют не только генерировать картинки, но и...

ChatGPT открыл доступ к функции Deep Research всем пользователям 

ChatGPT открыл доступ к функции Deep Research всем пользователям  OpenAI открыла доступ к функции Deep Research для всех...

Ideogram 3.0 — новая ИИ-модель для генерации изображений

Ideogram 3.0 — новая ИИ-модель для генерации изображений Сервис Ideogram, созданный бывшими сотрудниками Google Brain, объявил о масштабном...

OpenAI интегрировала GPT-4.1 в ChatGPT

OpenAI интегрировала GPT-4.1 в ChatGPT 14 апреля 2025 года OpenAI представила GPT-4.1 — новую языковую модель, которая теперь...

Этика искусственного интеллекта: философские дилеммы цифровой эпохи

Современная цивилизация переживает беспрецедентную трансформацию, в центре которой находится стремительное развитие искусственного интеллекта. Технологии, которые еще недавно казались...

ChatGPT начнёт пересказывать статьи Washington Post

ChatGPT начнёт пересказывать статьи Washington Post 22 апреля компания OpenAI объявила о стратегическом партнёрстве с изданием The Washington...

OpenAI открыла бесплатный доступ к «продвинутому» голосовому режиму ChatGPT

OpenAI открыла бесплатный доступ к «продвинутому» голосовому режиму ChatGPT OpenAI объявила о запуске Advanced Voice Mode на базе...

Обучение работе с ChatGPT — 10 лучших курсов 2025 года

Обучение работе с ChatGPT — 10 лучших курсов 2025 года ChatGPT — это чат-бот от OpenAI, выпущенный в...

10 нейросетей для создания карточек на маркетплейсах — Wildberries и Ozon

10 нейросетей для создания карточек на маркетплейсах — Wildberries и Ozon Нейросети способны значительно ускорить и упростить заполнение...

OpenAI запустила ИИ-агента Codex для программирования — он работает в облаке и подключается к GitHub

OpenAI запустила ИИ-агента Codex для программирования — он работает в облаке и подключается к GitHub OpenAI представила автономного...

Вышел Kling AI 2.0 Master — разбираем, что нового

Вышел Kling AI 2.0 Master — разбираем, что нового Компания Kuaishou объявила о выходе нейросети Kling AI 2.0...

Freepik выпустила «этичную» модель генерации изображений F-Lite — её обучали только на лицензированном контенте

Freepik выпустила «этичную» модель генерации изображений F-Lite — её обучали только на лицензированном контенте Freepik — один из...

Что такое промт-инжиниринг и кто такие промпт-инженеры — простыми словами

Что такое промт-инжиниринг и кто такие промпт-инженеры — простыми словами Ты даёшь нейросети задание — она пишет банальность....

Генерация изображений в ChatGPT — как создать картинку бесплатно

Генерация изображений в ChatGPT — как создать картинку бесплатно Создавать уникальные изображения теперь может каждый — прямо в...

Adobe добавит ИИ-агентов в Photoshop и Premiere Pro

Adobe добавит ИИ-агентов в Photoshop и Premiere Pro Компания Adobe готовит серьёзное обновление для своих ключевых продуктов —...

Яндекс научил Поиск объяснять сложные задачи по алгебре для старшеклассников

Яндекс научил Поиск объяснять сложные задачи по алгебре для старшеклассников Яндекс продолжает развивать интеллектуальные функции своего Поиска: теперь...

В веб-версии Grok появились «Персоны» — новая опция для выбора стиля общения

В веб-версии Grok появились «Персоны» — новая опция для выбора стиля общения Компания xAI выпустила обновление для веб-версии...

Память в ChatGPT: что делать если заполнена, как очистить или увеличить

Память в ChatGPT: что делать если заполнена, как очистить или увеличить Представьте, вы начинаете рабочий день, открываете рабочий...