В понедельник во время прямой трансляции из штаб-квартиры компании OpenAI в Сан-Франциско, ее ехнический директор Мира Мурати объявила, что ChatGPT предложит новую, более мощную модель искусственного интеллекта под названием GPT-4o.
GPT-4o («o» от «omni») – это «шаг к гораздо более естественному взаимодействию человека с компьютером: он принимает в качестве входных данных любую комбинацию текста, звука и изображения и генерирует любую комбинацию выходных текста, аудио и изображений» – говорится на сайте OpenAI.
Издание Wired рассказало, что ChatGPT во время презентации использовал разные эмоциональные тона и иногда реагировал так, как будто испытывал собственные чувства. Когда сотрудник OpenAI говорила о том, какой «полезный и удивительный» чат-бот, тот кокетливо ответил: «Ой, перестань, ты заставляешь меня краснеть».
«Это просто волшебно, и это замечательно», – сказала Мурати, добавив: «В течение следующих нескольких недель мы будем предоставлять эти возможности всем».
Во время другой демонстрации ChatGPT ответил на приветствие исследователя OpenAI Баррета Зофа вопросом: «Как я могу украсить ваш сегодняшний день?»
Когда Зоф попросил чат-бота посмотреть на его селфи и сказать, какие эмоции он испытывает, ChatGPT ответил: «Я надеваю шляпу счастливого детектива», и тепло добавил: «Похоже, ты чувствуешь себя довольно счастливым и веселым…, что бы ни происходило, похоже, у тебя отличное настроение».
В своем блоге в понедельник генеральный директор OpenAI Сэм Альтман подчеркнул важность нового интерфейса.
«Это похоже на ИИ из фильмов; и меня до сих пор немного удивляет, что это реально», – написал Альтман.
Модель объединяет множество функций, которые уже доступны по отдельности в различных других разработках OpenAI. Это позволяет ей более эффективно обрабатывать любые комбинации текстовых, аудио- и визуальных данных.
ChatGPT-4o может реагировать на аудиовход всего за 232 миллисекунды, в среднем 320 миллисекунд, что аналогично времени реакции человека в разговоре.
GPT-4o лучше воспринимает изображение и звук по сравнению с другими существующими моделями.
Пользователи получат возможность использовать визуальные данные разными способами. Можно использовать камеру телефона, загружать документы или делиться экраном с собеседниками и при этом одновременно общаться с ИИ-моделью, так как это происходит во время видеозвонка.
Модель поддерживается более чем на 50 языках, в том числе на русском, казахском, грузинском, китайском, арабском, турецком и сербском. Кроме того, GPT-4o может запоминать диалоги.
GPT-4o уже доступен для пользователей. Доступ к голосовым функциям в ближайшее время появится у небольшой группы партнеров.
Пока ChatGPT-4o доступен бесплатно, но при оформлении платной подписки, которая станет возможна с начала июня, лимит взаимодействия с ПО увеличится в пять раз.
Представленный миру компанией OpenAI в 2022 году ChatGPT стал сенсацией благодаря своей замечательной способности отвечать на вопросы и генерировать текст с человеческим пониманием.
Однако OpenAI и ее основные конкуренты, такие как Google, до сих пор в целом стремились ограничить антропоморфизм своих чат-ботов, отказываясь давать ПО возможность отвечать на определенные типы вопросов и заставляя модели напоминать пользователям, что они представляют собой всего лишь компьютерные программы.
Несмотря на эту осторожность, иногда реалистичные реплики последних чат-ботов могут задействовать эмоции пользователей.
Некоторые компании адаптировали технологию, чтобы максимизировать это явление, предлагая ИИ-компаньонов, которые разыгрывают различные человеческие эмоции или предлагаются в качестве ИИ-романтических партнеров или друзей.
Некоторые исследователи ИИ предупреждают, что долгосрочные последствия внедрения программ, имитирующих эмоции и реагирующих на них, могут быть нежелательными.
В прошлом месяце команда Google DeepMind опубликовала исследовательскую работу, в которой изучаются этические риски, которые могут возникнуть по мере того, как ИИ-помощники становятся более способными.
Помимо прочего, исследователи предупреждают, что такие помощники могут стать очень убедительными и вызвать привыкание. В прошлом году британец признал себя виновным в нарушении безопасности в Виндзорском замке, заявив, что чат-бот, с которым он обменялся более чем 5000 сообщениями, подстрекал его к этому.
Конкуренция между компаниями, работающими над ИИ, вряд ли утихнет. Ожидается, что Google в скором времени представит собственные технологии искусственного интеллекта.