Причина, по которой вы можете задать ChatGPT вопрос "как съесть манго, не пролив его" и многое другое, заключается в графических процессорах Nvidia H100 и B200. Эти волшебные чипсеты, которые обеспечивают работу чат-ботов с искусственным интеллектом, позволили Nvidia стать лидером в индустрии аппаратного обеспечения с искусственным интеллектом, а рыночная капитализация достигла отметки в 3 триллиона долларов - больше, чем у Microsoft и Apple в прошлом месяце.
Но теперь относительно молодой стартап, основанный двумя новичками из Havard, положил глаз на свою долю аппаратного обеспечения для искусственного интеллекта. Калифорнийский стартап Etched стремится завоевать рынок чипсетов для искусственного интеллекта с помощью своего трансформаторного чипа ASIC (Application Specific Integrated Circuits) под названием Sohu.
Sohu утверждает, что работает с такими трансформаторами, как ChatGPT, в 20 раз быстрее, чем флагман Nvidia - H100. Согласно заявлениям компании, основанным на тестах эмуляции, B200, который является более мощным по сравнению с H100 от Nvidia, работает в 10 раз медленнее, чем Sohu.
Источник: X/@Etched
Sohu использует совершенно другой подход к обеспечению высокой вычислительной мощности для обработки миллиардов параметров (переменных, которые используются при обучении модели искусственного интеллекта) для моделей трансформаторов. В отличие от графических процессоров, которые могут выполнять множество сложных вычислительных задач (например, рендеринг графики в режиме реального времени), Etched решила создать специализированный чип, который будет работать только с моделями transformer AI - такими, как ChatGPT, Sora (модель преобразования текста в видео от OpenAI) и Google Gemini.
Это означает, что он не может запускать другие модели ИИ, такие как сверточные нейронные сети (используемые для распознавания изображений). Это открывает разработчикам возможность изучать новые продукты ИИ, которые до сих пор были невозможны из-за ограниченной мощности графических процессоров.
Например, Sohu потенциально может стать переводчиком в режиме реального времени, который может слышать и читать на хинди, гуджарати или тамильском и отвечать на французском, английском и немецком языках. Конечно, для такого мультимодального и многоязычного перевода требуется больше, чем просто вычислительная мощность, но теоретически это открывает возможности.
Еще одно мультимодальное применение transformers, которое может быть использовано в наборе микросхем, - это интеграция визуальной и языковой областей. По сути, это означает, что такая модель будет понимать и текст, и изображения одновременно, что открывает возможность визуальных вопросов и ответов - как в интервью.
Но все это остается теорией. 25 июня компания Etched собрала 120 миллионов долларов, чтобы воплотить это в жизнь, при этом реальные сроки выпуска ASIC Sohu остаются неясными.
Сегодня мы объявили о сборе средств в размере 120 миллионов долларов, чтобы представить Sohu миру. Спасибо @edludlow за то, что приютил нас! https://t.co/khzMPAofng pic.twitter.com/Q4SeuUjP2h
— Etched (@Etched) 26 июня 2024 г.
Компания Etched заявила, что у нее уже есть оборудование на сумму в десятки миллионов долларов, зарезервированное в рамках предварительных заказов. Компания также заключила сделку с TSMC (Taiwan Semiconductor Manufacturing Company) на изготовление 4-нанометрового чипа, пообещав, что сделка поможет "увеличить наш первый год производства".