OpenAI запустила новую, улучшенную версию своей технологии искусственного интеллекта, использующую популярный инструмент генерации сообщений ChatGPT. Эта обновленная модель, получившая название GPT-4o (“o” означает "omni"), обещает более высокую производительность и еще больше приближает взаимодействие с человеком. Это также бесплатно для всех пользователей.
Это объявление появилось в преддверии ожидаемого выхода Google Gemini, собственного инструмента искусственного интеллекта, который напрямую конкурирует с ChatGPT.
GPT-4o: Функции
1. GPT-4o обеспечивает более быстрое и естественное взаимодействие человека с машиной по сравнению с более ранними версиями ChatGPT.
2. Он может понимать вводимые данные, такие как текст, аудио и изображения, и выдавать выходные данные в любой комбинации этих форматов.
3. Он отличается быстрым временем отклика: аудиовходы получают ответ всего за 232 миллисекунды, что соответствует скорости человеческого общения.
4. GPT-4o - это первая модель, которая обрабатывает текст, визуальные эффекты и аудио одновременно.
5. Он соответствует GPT-4 Turbo в области анализа текста, логических рассуждений и кодирования, превосходя предыдущие стандарты в многоязычном понимании, аудиозаписи и визуальном распознавании.
6. Он работает быстрее, чем GPT-4 Turbo, и на 50% дешевле в API.
7. Он поставляется со специальным настольным приложением, что упрощает выполнение повседневных задач.
8. Теперь вы можете загружать документы и скриншоты непосредственно в GPT-4o, упрощая рабочий процесс.
9. Он оснащен функцией памяти, которая помогает GPT-4o запоминать прошлые разговоры.
10. Вы можете просматривать информацию непосредственно в GPT-4o
GPT-4o: Возможности
OpenAI перечислил впечатляющие возможности GPT-4o в теме, опубликованной на X. На одном из слайдов мы видим сравнение между ChatGPT и GPT-4o, причем два из них взаимодействуют бок о бок. GPT-4o продемонстрировал более быстрое время отклика при использовании только аудиовходов.
Поприветствуйте GPT-4o, нашу новую флагманскую модель, которая может анализировать звук, изображение и текст в режиме реального времени: https://t.co/MYHZB79UqN Сегодня в API и ChatGPT появился ввод текста и изображений, а в ближайшие недели - голос и видео. pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI) 13 мая 2024 г.
1. Были продемонстрированы возможности перевода в режиме реального времени с английского на испанский и наоборот.
2. GPT-4o может создать или спеть колыбельную по подсказке.
3. Модель точно определила празднование дня рождения по визуальной подсказке, на которой изображен торт со свечой.
4. GPT-4o предоставляет подробные описания окружающей обстановки с помощью камеры, что служит наглядным пособием для слабовидящих.
5. GPT-4o обладает широким спектром возможностей – от передачи анекдотов про папу до быстрого счета, участия в групповых встречах и решения математических задач.
6. Он также обладает музыкальными талантами, а его вокал распространяется на пение и гармонизацию мелодий по запросу.
7. GPT-4o также может помочь вам в подготовке к собеседованию.
8. Он также может поддерживать беседу с домашними животными, такими как собаки.
9. Модель может изменять свой голос, чтобы передавать различные эмоции и выражения лица, от драматических до эмоциональных.
10. Она использует функцию визуализации для пошагового руководства выполнением заданий, включая решение математических задач и кодирование.