В первые годы для того, чтобы заставить модели искусственного интеллекта, такие как ChatGPT или его конкурент Cohere, выдавать человекоподобные ответы, требовались огромные команды недорогостоящих работников, помогающих моделям различать основные факты, например, изображение автомобиля или моркови.
Но более сложные обновления моделей искусственного интеллекта в условиях жесткой конкуренции в настоящее время требуют быстро расширяющейся сети инструкторов-людей, обладающих специальными знаниями, - от историков до ученых, некоторые из которых имеют докторские степени.
"Год назад нам могло сойти с рук нанимать студентов старших курсов, чтобы они просто обучали искусственный интеллект тому, как его совершенствовать", - сказал соучредитель Cohere Иван Чжан, рассказывая о своих внутренних тренерах-людях.
"Теперь у нас есть лицензированные врачи, которые обучают моделей тому, как вести себя в медицинских условиях, или финансовые аналитики или бухгалтеры".
Для дополнительного обучения компания Cohere, стоимость которой в последний раз превышала 5 миллиардов долларов, сотрудничает со стартапом Invisible Tech. Cohere является одним из главных конкурентов OpenAI и специализируется на искусственном интеллекте для бизнеса.
Стартап Invisible Tech нанимает тысячи инструкторов, работающих удаленно, и стал одним из основных партнеров компаний, занимающихся ИИ, от AI21 до Microsoft, для обучения их моделей ИИ уменьшению количества ошибок, известных в мире ИИ как галлюцинации.
"У нас 5000 сотрудников в более чем 100 странах по всему миру, которые являются докторами наук, магистрами и специалистами в области интеллектуального труда", - сказал основатель Invisible Фрэнсис Педраза.
Invisible платит до 40 долларов в час, в зависимости от местоположения работника и сложности работы. Некоторые компании, такие как Outlier, платят до 50 долларов в час, в то время как другая компания под названием Labelbox заявила, что платит до 200 долларов в час за "сложные предметы", такие как квантовая физика, но за базовые темы платит от 15 долларов.
Invisible была основана в 2015 году как компания по автоматизации документооборота, обслуживающая такие компании, как компания по доставке еды DoorDash, для оцифровки их меню доставки. Но все изменилось, когда весной 2022 года, в преддверии публичного запуска ChatGPT, с ними связалась относительно неизвестная исследовательская фирма OpenAI.
"OpenAI обратился к нам с проблемой, которая заключалась в том, что, когда вы задавали вопрос в ранней версии ChatGPT, он вызывал галлюцинации. Вы не могли доверять ответу", - сказал Педраза агентству Reuters.
"Им нужен был продвинутый партнер по обучению ИИ, который обеспечивал бы обучение с подкреплением обратной связью с людьми".
В OpenAI не ответили на запрос о комментариях.
Генеративный ИИ создает новый контент на основе прошлых данных, которые использовались для его обучения. Однако иногда он не может отличить правдивую информацию от ложной и генерирует ложные результаты, известные как галлюцинации. В одном из примечательных примеров, в 2023 году чат-бот Google поделился неточной информацией о том, какой спутник впервые сфотографировал планету за пределами Солнечной системы Земли, в рекламном ролике.
Компании, занимающиеся искусственным интеллектом, осознают, что галлюцинации могут подорвать привлекательность GenAI для бизнеса, и пытаются различными способами снизить ее, в том числе с помощью инструкторов-людей, которые учат отличать факты от вымысла.
С момента запуска OpenAI, Invisible заявила, что стала партнером по обучению ИИ для большинства компаний GenAI, включая Cohere, AI21 и Microsoft. Cohere и AI21 подтвердили, что являются клиентами. Microsoft не подтвердила, что является клиентом Invisible.
"Все эти компании сталкивались с трудностями в обучении, когда на первом месте у них были затраты на вычислительную мощность, а на втором - на качественное обучение", - сказал Педраза.
КАК ЭТО РАБОТАЕТ?
В OpenAI, которая положила начало ажиотажу вокруг GenAI, есть команда исследователей, метко названная "Human Data Team", которая работает с инструкторами по ИИ, собирая специализированные данные для обучения своих моделей, таких как ChatGPT.
Исследователи OpenAI проводят различные эксперименты, такие как уменьшение галлюцинаций или улучшение стиля письма, а также работают с инструкторами по ИИ от Invisible и других поставщиков, сообщил источник, знакомый с процессами компании.
По словам этого человека, в любой момент проводятся десятки экспериментов, некоторые из которых основаны на инструментах, разработанных OpenAI, а другие - на инструментах поставщиков.
Исходя из того, чего хотят компании, занимающиеся ИИ, - от улучшения знаний в области истории Швеции или финансового моделирования, - Invisible нанимает сотрудников с соответствующими степенями для этих проектов, что снижает нагрузку компаний, занимающихся ИИ, на управление сотнями инструкторов.
"В OpenAI работают одни из самых потрясающих специалистов в области компьютерных технологий в мире, но они не обязательно являются экспертами по истории Швеции, химии, биологии или чему-либо еще, что вы можете задать", - сказал Педраза, добавив, что только в OpenAI работают более 1000 контрактников.
Чжан из Cohere сказал, что он лично использовал инструкторов Invisible, чтобы найти способ научить свою модель GenAI находить соответствующую информацию из большого набора данных.
соревнование
Среди конкурентов в этой области - Scale AI, частный стартап, стоимость которого в прошлом году оценивалась в 14 миллиардов долларов и который предоставляет компаниям, работающим с ИИ, наборы обучающих данных. Он также занимается предоставлением инструкторов по ИИ и считает OpenAI своим клиентом. Scale AI не ответила на запросы об интервью для этой статьи.
Invisible, которая приносит прибыль с 2021 года, привлекла всего 8 миллионов долларов первичного капитала,
"Мы на 70% принадлежим команде, и только на 30% - инвесторам", - сказал Педраза. "Мы проводим вторичные раунды, и последняя цена сделки была оценена в полмиллиарда долларов". Агентство Рейтер не смогло подтвердить эту оценку.
Инструкторы-люди впервые занялись обучением ИИ благодаря работе по маркировке данных, которая требовала меньшей квалификации и к тому же оплачивалась дешевле, иногда всего на 2 доллара, и в основном выполнялась людьми из африканских и азиатских стран.
По мере того как компании, занимающиеся ИИ, выпускают все более продвинутые модели, растет спрос на специализированных тренеров, владеющих десятками языков, что создает хорошо оплачиваемую нишу, в которой работники из самых разных областей могут стать тренерами по ИИ, даже не зная, как программировать.
Спрос со стороны компаний, занимающихся ИИ, приводит к созданию большего числа компаний, предлагающих аналогичные услуги.
"Мой почтовый ящик буквально завален новыми фирмами, которые появляются то тут, то там. Я рассматриваю это как новое пространство, где компании нанимают людей только для создания данных для лабораторий искусственного интеллекта, таких как мы", - сказал Чжан.
(За исключением заголовка, эта история не была отредактирована сотрудниками NDTV и опубликована на синдицированном канале).