• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

«Нейросети могут давать настолько же точные оценки, как и человек»

«Нейросети могут давать настолько же точные оценки, как и человек»

© Высшая школа экономики

Голосовые помощники стали частью обычной жизни. Они могут строить маршрут, включать музыку и фильмы, отвечать на вопросы. Качество речи голосовых ассистентов требует оценки. Для решения этой задачи студенты мастерской по прикладному искусственному интеллекту ИМШ НИУ ВШЭ и VK разработали нейросети, способные оценивать синтез речи.

Никита Шевцов

«Технологии Text-to-Speech превращают текст в речь. Это те самые голоса, которые мы слышим в навигаторах или аудиокнигах. Чтобы понять, насколько хорошо работает синтез, раньше требовалась ручная проверка: люди слушали записи и выставляли оценки. Мы решили автоматизировать этот процесс. Студентам мастерской предстояло создать систему, которая заменит субъективную оценку на нейросетевую модель. Ручная разметка не только дорогая и долгая, но и требует участия множества специалистов», — говорит Никита Шевцов, руководитель проекта мастерской по прикладному искусственному интеллекту ИМШ НИУ ВШЭ и VK.

Студенты мастерской ИМШ и VK использовали открытые англоязычные датасеты SOMOS, содержащие 20 100 аудиофрагментов, 200 TTS-систем, 987 асессоров и более 350 000 оценок.

На их основе были подготовлены и внедрены две метрики: MOS (Mean Opinion Score) — оценка одного аудиофайла от 1 до 5; SBS (Side-by-Side) — сравнение двух аудиофрагментов с выбором лучшего. Также были разработаны пять моделей: для MOS — MOSNet, MOSNetBert, WhisperBert; для SBS — NeuralSBS, NeuralSBSBert. Модели работают как в аудиоформате, так и в мультимодальном формате.

«Мы увидели, что нейросети могут давать настолько же точные оценки, как и человек. MOS-модели показали RMSE ≈ 0,4, что близко к человеческой погрешности 0,62. Модель NeuralSBS определяет лучшее аудио в 73% случаев — на уровне среднего субъективного слушателя. Это открывает путь к ускорению и удешевлению оценки качества TTS», — отметил Никита Шевцов.

Следующий этап — переобучение моделей на русском языке. Команда также рассматривает возможность интеграции оценочных моделей в пайплайны CI/CD, чтобы внедрить автоматическую проверку качества в производственные процессы генерации речи.

«Автоматическая оценка синтеза речи — это шаг к более надежным и масштабируемым TTS-системам. Мы собираемся сделать ее доступной для широкой разработки», — добавил Никита Шевцов.

Вам также может быть интересно:

ВШЭ ищет новые идеи для ИИ-агентов: стартовал конкурс инициатив

Высшая школа экономики приглашает исследователей и преподавателей представить концепции новых цифровых продуктов на базе искусственного интеллекта. Лучшие проекты получат экспертную и технологическую поддержку. Заявки принимаются до 19 декабря.

В Вышке создан Институт робототехнических систем

Решение об этом принял Ученый совет НИУ ВШЭ. У нового института будет мощная фундаментальная база, он будет сотрудничать с другими профильными подразделениями, вовлекать студентов и аспирантов в исследования и разработки. К каким практическим результатам приведет работа института и как планируется организовать взаимодействие с его индустриальным партнером, «Вышке.Главное» рассказал первый проректор НИУ ВШЭ, директор Института статистических исследований и экономики знаний Леонид Гохберг.

Ученые обнаружили один из самых долгих случаев ковида

Международная группа исследователей при участии ученых из НИУ ВШЭ изучила необычный образец вируса SARS-CoV-2 у ВИЧ-положительной пациентки. Генетический анализ позволил выявить множественные мутации и установить, что вирус эволюционировал в организме на протяжении 2 лет. Это подтверждает теорию о том, что вирус способен годами оставаться в организме отдельных людей, постепенно накапливать мутации и затем выплескиваться в популяцию. Результаты опубликованы в журнале Frontiers in Cellular and Infection Microbiology.

Восьмой международный онлайн-семинар U4U объединил экспертов из 14 стран

Онлайн-кампус НИУ ВШЭ провел двухдневный международный семинар U4U (Universities for Universities), который традиционно служит площадкой для обмена опытом между университетами в области онлайн-обучения. В этом году событие вышло на глобальный уровень и расширило географию. К обсуждению ключевых вызовов и стратегий развития онлайн-образования присоединились международные эксперты и представители университетов со всего мира. Встреча состоялась в онлайн-формате в середине ноября.

Технологический прорыв: исследования Института ИИ и цифровых наук отмечены на AI Journey 2025

Ученые Института искусственного интеллекта и цифровых наук факультета компьютерных наук ВШЭ в рамках Международной конференции AI Journey 2025 представили передовые ИИ-исследования с высоким уровнем научной новизны и практической применимости. Научное решение заведующего Научно-учебной лабораторией матричных и тензорных методов в машинном обучении Максима Рахубы получило премию «Лидеры ИИ — 2025». Заведующий Центром глубинного обучения и байесовских методов Айбек Аланов — среди финалистов премии.

НИУ ВШЭ стал лидером рейтинга вузов — участников программы «Приоритет-2030»

Министерство науки и высшего образования РФ опубликовало обновленный список участников программы «Приоритет-2030». Всего поддержку в этом году получат 106 университетов. Высшая школа экономики вошла в первую группу и возглавила рейтинг вузов.

«"Образовательные мосты” — место встречи коллег, которые не боятся трудных вопросов»

28–29 ноября в корпусе Высшей школы экономики на Покровском бульваре пройдет форум «Образовательные мосты: подходы к обучению в старшей школе». Организаторами выступают НИУ ВШЭ и Департамент образования и науки города Москвы. В этом году экспертная программа форума расширена до двух дней и включает в себя вдвое больше образовательных активностей, спикеров и возможностей для нетворкинга.

Ученые НИУ ВШЭ нашли рецепт против выгорания студентов

Исследователи Института образования НИУ ВШЭ показали, сколько времени имеет смысл тратить на учебу, внеучебную активность и личную жизнь, чтобы поддерживать успеваемость в вузе без ущерба для ментального здоровья. Анализ ответов 2753 студентов и их реальных академических показателей выявил точки риска, например избыток домашних заданий, и точки роста: сон, спорт, умеренную вовлеченность в проекты. С учетом полученных результатов ученые подготовили практические рекомендации для студентов и университетов. Работа опубликована в European Journal of Education.

«У нас возникают эффекты перелива идей от фундаментальных проектов к прикладным и — обратные»

Созданная 11 лет назад Международная лаборатория экономики нематериальных активов (МЛЭНА) дала старт созданию институционализированных научных подразделений в пермском кампусе Вышки. Компетенции сотрудников лаборатории по обработке и анализу данных позволили им сочетать фундаментальные исследования и прикладные проекты, в том числе по разработке моделей рисков и кибербезопасности для Сбера. О деятельности МЛЭНА «Вышке.Главное» рассказали заведующий лабораторией профессор Петр Паршаков и старший научный сотрудник профессор Мария Молодчик.

«Сегодня мы живем в эпохе “рутинной новизны”»

В НИУ ВШЭ продолжается реализация стратегического технологического проекта (СТП) «Национальный центр социально-экономического и научно-технологического прогнозирования». Новостная служба «Вышка.Главное» рассказывает о том, как в систему прогнозирования вписываются культура и общественные ценности и как на них влияет искусственный интеллект.