OpenAI запустила новую, улучшенную версию своей технологии искусственного интеллекта, использующую популярный инструмент генерации сообщений ChatGPT. Эта обновленная модель, получившая название GPT-4o (“o” означает "omni"), обещает более высокую производительность и еще больше приближает взаимодействие с человеком. Это также бесплатно для всех пользователей.

Это объявление появилось в преддверии ожидаемого выхода Google Gemini, собственного инструмента искусственного интеллекта, который напрямую конкурирует с ChatGPT.

GPT-4o: Функции

1. GPT-4o обеспечивает более быстрое и естественное взаимодействие человека с машиной по сравнению с более ранними версиями ChatGPT. 

2. Он может понимать вводимые данные, такие как текст, аудио и изображения, и выдавать выходные данные в любой комбинации этих форматов.

3. Он отличается быстрым временем отклика: аудиовходы получают ответ всего за 232 миллисекунды, что соответствует скорости человеческого общения.

4. GPT-4o - это первая модель, которая обрабатывает текст, визуальные эффекты и аудио одновременно. 

5. Он соответствует GPT-4 Turbo в области анализа текста, логических рассуждений и кодирования, превосходя предыдущие стандарты в многоязычном понимании, аудиозаписи и визуальном распознавании.

6. Он работает быстрее, чем GPT-4 Turbo, и на 50% дешевле в API.

7. Он поставляется со специальным настольным приложением, что упрощает выполнение повседневных задач.

8. Теперь вы можете загружать документы и скриншоты непосредственно в GPT-4o, упрощая рабочий процесс.

9. Он оснащен функцией памяти, которая помогает GPT-4o запоминать прошлые разговоры.

10. Вы можете просматривать информацию непосредственно в GPT-4o 

GPT-4o: Возможности 

OpenAI перечислил впечатляющие возможности GPT-4o в теме, опубликованной на X. На одном из слайдов мы видим сравнение между ChatGPT и GPT-4o, причем два из них взаимодействуют бок о бок. GPT-4o продемонстрировал более быстрое время отклика при использовании только аудиовходов. 

Поприветствуйте GPT-4o, нашу новую флагманскую модель, которая может анализировать звук, изображение и текст в режиме реального времени: https://t.co/MYHZB79UqN Сегодня в API и ChatGPT появился ввод текста и изображений, а в ближайшие недели - голос и видео. pic.twitter.com/uuthKZyzYx

— OpenAI (@OpenAI) 13 мая 2024 г.

1. Были продемонстрированы возможности перевода в режиме реального времени с английского на испанский и наоборот.

2. GPT-4o может создать или спеть колыбельную по подсказке.

3. Модель точно определила празднование дня рождения по визуальной подсказке, на которой изображен торт со свечой.

4. GPT-4o предоставляет подробные описания окружающей обстановки с помощью камеры, что служит наглядным пособием для слабовидящих.

5. GPT-4o обладает широким спектром возможностей – от передачи анекдотов про папу до быстрого счета, участия в групповых встречах и решения математических задач.

6. Он также обладает музыкальными талантами, а его вокал распространяется на пение и гармонизацию мелодий по запросу.

7. GPT-4o также может помочь вам в подготовке к собеседованию. 

8. Он также может поддерживать беседу с домашними животными, такими как собаки.

9. Модель может изменять свой голос, чтобы передавать различные эмоции и выражения лица, от драматических до эмоциональных.

10. Она использует функцию визуализации для пошагового руководства выполнением заданий, включая решение математических задач и кодирование.