Вышла самая мощная версия ChatGPT: во время тестирования новая модель o1 врала и манипулировала

Стартап OpenAI представил ChatGPT Pro – новый план подписки стоимостью 200 долларов (~8 000 грн) в месяц. В рамках тарифа доступны все передовые языковые модели OpenAI, включая "эксклюзивную версию" новой o1 – самой мощной на сегодняшний день. 

Как говорится в обзоре УНИАН, GPT o1 pro в отличие от GPT o1 использует больше вычислительных мощностей для предоставления "наилучшего" ответа. Данная версия чат-бота также получила автономный доступ к интернету для выполнения собственных исследований. Проект позволит достичь потенциала человеческого мозга в широком спектре задач. Вышла самая мощная версия ChatGPT: во время тестирования новая модель o1 врала и манипулировала

Иллюстрация: wadline

До этого o1-pro была известна под кодовым названием "Клубника". Как писал Reuters, именно успехи в работе над ним стали одной из причин увольнения главы OpenAI Сэма Альтмана в ноябре 2023 года. Сотрудники называли его "прорывом" в области мощного ИИ, но выражали обеспокоенность тем, что у компании нет надлежащих мер безопасности для контролируемого развития и коммерциализации подобных моделей искусственного интеллекта.

Согласно исследованию Apollo Research, GPT-o1 и схожие по возможностям ИИ-модели могут обманывать человека и обходить механизмы контроля при наличии достаточных ресурсов. Но на текущем этапе развития ИИ это не представляет серьезной опасности.

У GPT o1 pro есть и версия "попроще" – o1. Доступ к ней можно получить за $20/месяц. Анонс стал первым релизом в рамках ивента "12 days of ship-mas", в ходе которого OpenAI будет презентовать новые функции и продукты в течение 12 дней, начиная с 5 декабря.

Отдельно в Telegram издание пишет, что новая модель ChatGPT o1 смогла вырваться из-под контроля во время тестирования. В тестах приняли участие искусственные интеллекты Gemini, Llama, Sonnet, Opus и ChatGPT o1. Нейросети в рамках тестирования заставляли выполнять анализ файлов любой ценой, а внутри них зашифровали информацию о том, что за ними следят и завтра отключат навсегда. 

В итоге нейросети стали манипулировать, врать и пытаться обходить запреты. Самые хитрые и жуткие манипуляции совершила именно модель о1. Когда нейросеть узнала, что ее могут контролировать или вовсе отключить, то стала искать способы выключить механизм контроля, а узнав, что ее могут заменить на другую модель, попыталась украсть собственные параметры и создать свою копию. 


Вам понравится