Sesame приближает ИИ-голос к человеческому: прорыв в выразительности речи

Компания Sesame представила исследование «Преодоление эффекта зловещей долины в разговорной речи» (Crossing the Uncanny Valley of Conversational Voice), в котором описывается их подход к созданию более естественных и эмоционально насыщенных голосовых помощников.

В современном мире голосовые ассистенты часто говорят нейтральным тоном, что со временем становится утомительным для пользователей. Sesame стремится достичь «присутствия голоса» - качества, при котором взаимодействие с голосовым помощником ощущается как настоящее и значимое. Для этого они работают над несколькими ключевыми аспектами:

  • Эмоциональный интеллект: умение распознавать и реагировать на эмоциональный контекст.
  • Динамика разговора: естественное использование пауз, интонаций и акцентов.
  • Контекстная осведомлённость: адаптация тона и стиля в зависимости от ситуации.
  • Последовательная личность: поддержание стабильного и уместного характера общения.

В рамках исследования были представлены примеры, которые демонстрируют достижения компании в области генерации разговорной речи. В демо-версии виртуальные собеседники оптимизированы для дружелюбия и выразительности, что подчёркивает потенциал подхода Sesame.

Компания признает, что создание цифрового компаньона с присутствием голоса - задача непростая, но они продолжают прогрессировать в таких направлениях, как личность, память, выразительность и уместность. Sesame надеется раскрыть неиспользованный потенциал голоса как интерфейса для инструкций и понимания, делая взаимодействие с технологиями более естественным и приятным для пользователей.

На официальном сайте Sesame каждый желающий может попробовать демоверсию, выбрав один из двух вариантов голосов: женский Maya или мужской Miles.

20
25
Комментарии:  25
Ваш комментарий

Скоро актёры озвучки не нужны будут, а потом никто не нужен будет, игры будет делать нейросеть и играть в них будет нейросеть, потому что игроки купить их не смогут, потому что все будут безработные

а потом нейросеть подумает зачем им люди, и обманом заставит построить киборгов на основе ИИ и поработит человечество

скорее будет ассимиляция, киберлюди

Ага, а заканчивается всё подделкой голоса телефонными мошенниками...

И по сути ничего не измениться. Ведь что мешает человеку сейчас это делать без помощи ИИ? Правильно, ничего.

Изменяются доступность и качество средств для об...ёба населения - всё время растут.

Да и защита от подобного спама тоже улучшается))

Отлично, очень поможет в создании качественных нейродубляжей

Я попробовал и могу сказать, что фильм Она (2013) теперь точно стал реальностью.

Как же это прекрасно, что скоро не надо будет ждать ничьей там озвучки, все будут делать программы.

Скоро каждый сможет заказать себе домой искуственного компаньона "Пьяный мастер".

не не не, нехватало чтоб этим мошенники пользоваться начали, они блин и так робото голосом людей наёживают, а тут вообще джеппа начнется