Более 100 лет назад Александр Грэхем Белл обратился к читателям National Geographic с просьбой сделать что–то смелое и свежее - “основать новую науку”. Он отметил, что науки, основанные на измерениях звука и света, уже существовали. Но науки о запахах еще не было. Белл попросил своих читателей “измерить запах”.
Сегодня смартфоны, которые находятся в карманах большинства людей, предоставляют впечатляющие встроенные возможности, основанные на науке о звуке и свете: голосовые помощники, распознавание лиц и улучшение качества фотографий. Наука о запахах не предлагает ничего подобного. Но ситуация меняется, поскольку достижения в области машинного обоняния, также называемого “цифровым запахом”, наконец-то отвечают на призыв Белла к действию.
Исследования в области машинного обоняния сталкиваются с серьезными трудностями из-за сложности человеческого обоняния. В то время как зрение человека в основном зависит от рецепторных клеток сетчатки – палочек и трех типов колбочек, обоняние воспринимается примерно через 400 типов рецепторных клеток в носу.
Машинное обоняние начинается с датчиков, которые обнаруживают и идентифицируют молекулы в воздухе. Эти датчики служат той же цели, что и рецепторы в вашем носу.
Но чтобы быть полезными для людей, машинное обоняние должно пойти еще дальше. Система должна знать, как пахнет определенная молекула или набор молекул для человека. Для этого машинному обонянию необходимо машинное обучение.
Применение машинного обучения к запахам
Машинное обучение, и в частности разновидность машинного обучения, называемая глубоким обучением, лежит в основе таких замечательных достижений, как голосовые помощники и приложения для распознавания лиц.
Машинное обучение также является ключом к оцифровке запахов, поскольку оно может научиться сопоставлять молекулярную структуру вызывающего запах соединения с текстовыми описателями запаха. Модель машинного обучения изучает слова, которые люди обычно используют, например, “сладкий” и “десерт”, для описания того, что они испытывают, когда сталкиваются с определенными веществами, вызывающими запах, такими как ванилин.
Однако для машинного обучения требуются большие массивы данных. В Интернете имеется невообразимо огромное количество аудио-, графического и видеоконтента, который может быть использован для обучения систем искусственного интеллекта, распознающих звуки и изображения. Но машинное обоняние уже давно сталкивается с проблемой нехватки данных, отчасти из-за того, что большинство людей не могут словесно описать запахи так же легко и узнаваемо, как виды и звуки. Не имея доступа к наборам данных веб-масштаба, исследователи не смогли создать действительно мощные модели машинного обучения.
Однако ситуация начала меняться в 2015 году, когда исследователи запустили конкурс DREAM Olfaction Prediction Challenge. В рамках конкурса были опубликованы данные, собранные Андреасом Келлером и Лесли Восшалл, биологами, изучающими обоняние, и приглашены команды со всего мира представить свои модели машинного обучения. Модели должны были предсказать запаховые метки, такие как “сладкий”, “цветочный” или “фруктовый”, для соединений, вызывающих запах, на основе их молекулярной структуры.
Наиболее эффективные модели были опубликованы в статье в журнале Science в 2017 году. Победителем оказался классический метод машинного обучения под названием random forest, который сочетает в себе результаты нескольких блок-схем дерева принятия решений.
Я исследователь в области машинного обучения и давно интересуюсь применением машинного обучения в химии и психиатрии. Задача МЕЧТЫ вызвала у меня интерес. Я также почувствовала личную связь с обонянием. Корни моей семьи уходят в небольшой городок Каннаудж на севере Индии, который является парфюмерной столицей Индии. Кроме того, мой отец - химик, который большую часть своей карьеры занимался анализом геологических образцов. Таким образом, технология машинного обоняния предоставила невероятные возможности на стыке парфюмерии, культуры, химии и машинного обучения.
После завершения конкурса DREAM challenge прогресс в области машинного обоняния начал набирать обороты. Во время пандемии COVID-19 сообщалось о многих случаях обонятельной слепоты, или аносмии. Обоняние, которое обычно отодвигается на второй план, привлекло внимание общественности. Кроме того, исследовательский проект Pyrfume Project сделал общедоступными все новые и новые наборы данных.
Глубоко вдыхая запах
К 2019 году количество самых крупных наборов данных выросло с менее чем 500 молекул в DREAM challenge до примерно 5000 молекул. Исследовательская группа Google под руководством Александра Вильчко наконец-то смогла осуществить революцию в области машинного обоняния, основанную на глубоком обучении. Их модель, основанная на методе глубокого обучения, называемом графическими нейронными сетями, позволила достичь самых современных результатов в области машинного обоняния. В настоящее время Вильчко является основателем и генеральным директором Osmo, миссия которой заключается в том, чтобы “дать компьютерам чувство обоняния”.
Недавно Вильчко и его команда использовали графическую нейронную сеть для создания “карты основных запахов”, на которой похожие запахи расположены ближе друг к другу, чем непохожие. Это было непросто: небольшие изменения в молекулярной структуре могут привести к значительным изменениям в обонятельном восприятии. И наоборот, две молекулы с очень разными молекулярными структурами, тем не менее, могут пахнуть почти одинаково.
Такой прогресс в расшифровке обонятельного кода не только увлекателен с интеллектуальной точки зрения, но и имеет многообещающие применения, включая персонализированные духи и отдушки, улучшенные средства от насекомых, новые химические датчики, раннее выявление заболеваний и более реалистичные возможности дополненной реальности. Будущее машинного обоняния выглядит радужным. Кроме того, он обещает приятно пахнуть.
(Автор: Амбудж Тевари, профессор статистики Мичиганского университета)
(Заявление о раскрытии информации: Амбудж Тевари не работает, не консультирует, не владеет акциями и не получает финансирования от какой-либо компании или организации, которые могли бы извлечь выгоду из этой статьи, и не раскрывает никакой соответствующей связи, кроме своей академической должности)
Эта статья перепечатана из The Conversation под лицензией Creative Commons. Прочтите оригинальную статью.
(За исключением заголовка, этот материал не редактировался сотрудниками NDTV и опубликован на синдицированном канале).