Студенты ДВФУ обучают синтетическую личность русскому языку

17 июня 2019 - Новости ДВФУ

Студенты кафедры «Банковское дело» Дальневосточного федерального университета (ДВФУ) совместно с исследовательской группой в области компьютерной лингвистики Школы цифровой экономики (ШЦЭ) записали десятки гигабайт часов живых диалогов технической поддержки, чтобы использовать полученные данные для обучения русскоязычной нейросети.

Технологическим партнером эксперимента выступает компания «Наносемантика», которая консультирует исследовательскую группу ШЦЭ в области построения систем распознавания речи. Эксперимент проводился в компьютерной лаборатории, основанной на грант Сбербанка как стратегического партнера школы.

«Эксперимент по записи диалогов обслуживания клиентов является началом глобального проекта по обработке естественных языков, который будет реализовываться на площадке ДВФУ», — заявил директор Школы цифровой экономики Илья Мирин.

По его словам, существующие системы распознавания русской речи пока довольно далеки от идеала, поскольку для русского языка не хватает хороших обучающих выборок. Студенты планируют создать такую выборку и на ее базе обучить так называемую синтетическую личность, которая будет распознавать человеческую речь и поддерживать продолжительную и осмысленную беседу на высоком уровне. С этой целью в будущем учебному году на специальность «Машинное обучение» в ШЦЭ особый акцент будет сделан на студентов, имеющих специальности «Лингвистика».

Напомним, первая в России Школа цифровой экономики открылась в 2018 году в ДВФУ. Она включает пять магистерских программ: «Искусственный интеллект и большие данные», «Технологии виртуальной и дополненной реальностей VR/AR», «Кибербезопасность», «Управление развитием территорий на основе технологий и данных дистанционного зондирования Земли», «Цифровое искусство».

Пресс-служба ДВФУ,
press@dvfu.ru