Код к сердцу: ИИ поможет распознать эмоции человека по голосу и словам



alttext

Нейросеть

Как новая программа облегчит работу психологов и банков

Российские программисты научили нейросеть определять эмоции человека по голосу. Для этого они в течение года воспроизводили различные ситуации и записывали реакции актеров на них в студии звукозаписи. В итоге получилась открытая библиотека, которую могут скачивать любые компании. Среди тех, кто уже пользуется программой, — банки и другие организации, которым важно отслеживать эмоциональное состояние клиентов, рассказали разработчики. Полезно изобретение будет и сотрудникам различных кризисных центров, врачам, работающим с детьми-аутистами, уверены эксперты.

Библиотека эмоций

Открытую библиотеку искусственного интеллекта для определения эмоций человека — Aniemore — создали российские разработчики Артем Аментес (МФТИ), Илья Лубенец (НИИ «Спецвузавтоматика») и Никита Давидчук (Институт опережающих технологий «Школа Х» ДГТУ). За год они собрали беспрецедентный набор голосовых данных и обучили девять нейросетей распознаванию семи эмоций человека по голосу и словам.

— Мы разработали библиотеку искусственного интеллекта на языке программирования python. Это позволяет просто копировать готовый код нашей разработки, вставлять его в любое российское программное обеспечение и обрабатывать текст, звук и видео, — рассказал «Известиям» Артем Аментес.

Программа, в которую интегрирован разработанный код, получает возможность определять эмоции в речи человека и добавлять эту аналитику в базу данных или выводить на экран пользователя. Весь набор данных и результаты исследований находятся в открытом бесплатном доступе, подчеркнули разработчики. По факту любой человек может скопировать код и использовать его по своему усмотрению.

— Среди пользователей мы видим организации, которым важно отслеживать эмоциональное состояние клиентов и сотрудников на основании их разговоров. Это банки, они одни из первых обратили внимание на использование нашей технологии. Возможно, ей воспользуются также МЧС и благотворительные кризисные организации, — рассказал Артем Аментес.

Также воспользоваться технологией смогут психологические центры и благотворительные организации. Быстрая система распознавания эмоционального состояния человека позволит обеспечить более персонализированный и гуманный подход к клиенту, отметили разработчики.

Разыграли спектакль

Для того чтобы эффективно научить нейросети распознавать эмоции, команда программистов арендовала звукозаписывающую студию. Специально для подбора данных был подготовлен сценарий из 54 различных ситуаций: «на заправке», «в магазине», «в автобусе», «дома» и др. В каждой из ситуаций профессиональные актеры разыгрывали спонтанные эмоциональные диалоги, которые программисты разводили по звуковым дорожкам. В итоге команда смогла собрать больше трех часов эмоциональных диалогов от более чем 200 актеров.

Обычно разработка подобного решения под заказ стоит от 20 млн рублей. Но благодаря разработчикам, которые выложили код в открытый доступ, библиотека стала общедоступной.

— Библиотека готова к установке и не требует никакой настройки, — говорит Артем Аментес.

Команда стала победителем конкурса «Код — Искусственный интеллект», проводимого по федеральному проекту «Искусственный интеллект» национального проекта «Цифровая экономика», получив грант в размере 6 млн рублей.

— Конкурс «Код-ИИ» — уникальная мера поддержки разработчиков открытых библиотек в сфере искусственного интеллекта. Впервые государство предоставляет гранты на разработку open source решений. Эта мера поддержки будет способствовать расширению практики применения технологий ИИ, — рассказал заместитель генерального директора Фонда содействия инновациям Павел Гудков.

Фонд впервые провел конкурс «Код-ИИ» в 2021 году. За это время уже 36 команд получили более 270 млн рублей на реализацию своих проектов. Максимальный размер гранта — 10 млн рублей на проектную команду и 2 млн на одного участника.

Актуальная задача

Сегодня быстро развивается консультирование на онлайн-платформах, запускаются различные приложения помощи людям, переживающим деструктивные эмоции и состояния: страх, отчаяние, депрессию, тревогу, апатию. Ряд методик поддержки таких людей основан на помощи в распознавании своих чувств и эмоций, рассказала «Известиям» клинический психолог, руководитель НПЦ «Виртуальная клиника» Московского института психоанализа Ольга Валаева.

— Даже небольшие стартапы в области онлайн-психологической помощи теперь смогут использовать библиотеку Aniemore для быстрого запуска приложения или чат-бота постоянного сопровождения клиентов с депрессивными или тревожными расстройствами. Открытый доступ к библиотеке также позволит разрабатывать больше приложений для сопровождения людей с расстройствами аутистического спектра (РАС), испытывающими затруднения в понимании и передаче своего эмоционального состояния. Развитие способности к распознаванию эмоций у детей с РАС приводит к развитию воображения, формированию наглядно-образного мышления, — отметила она.

По данным ВОЗ, ежегодно число детей с аутизмом увеличивается на 13%, так что разработка сервисов поддержки детей и подростков с РАС становится как никогда актуальной, подчеркнула Ольга Валаева.

Направление в области изучения искусственного интеллекта, безусловно, очень перспективно, рассказала практикующий психолог, старший преподаватель Московского института психоанализа Анастасия Пономаренко. Но все-таки это больше вопрос будущего, чем настоящего.

— Эмоции настолько сложны и многогранны, что распознать их может только человек. Мы уже давно и активно используем «Алису», но, разговаривая с ней, понимаем, что говорим не с человеком. Поэтому в будущем возможно, но в настоящем вряд ли, — подчеркнула специалист.

Например, искусственный интеллект иногда путает картины Рубенса и порнографию, привела аналогию психолог. Поэтому перед разработчиками сейчас стоит сложная задача — точнее научить распознавать ИИ эмоции по голосу, поскольку в них очень много нюансов и разобраться в них пока под силу только человеку, отметила эксперт.

Мария Недюк, Известия