Soul App недавно совершил крупный прорыв в области «ИИ+социал»! Редактор Downcodes узнал, что Soul официально объявила о том, что ее собственная разработка сквозной полнодуплексной модели голосовых вызовов была снова обновлена, что позволяет вести естественные и плавные голосовые разговоры с виртуальными людьми так же естественно и плавно, как и реальные люди. Этот шаг знаменует собой важный шаг для Soul в применении технологии искусственного интеллекта, предоставляя пользователям более захватывающий и интерактивный социальный опыт. В этой статье мы углубимся в уникальные особенности этой большой модели и исследования Soul в социальной сфере ИИ.
На внутреннем треке «ИИ + социальные сети» Soul App собирается использовать ИИ для придания новой жизненной силы!
Недавно Soul официально объявила, что ее голосовая модель снова была обновлена, и была запущена собственная разработка сквозной полнодуплексной модели голосовых вызовов.
Самым удивительным эффектом этого обновления является то, что голосовой вызов между пользователем и виртуальным человеком может быть таким же естественным и плавным, как общение с реальным человеком!
Насколько реалистичен эффект? Вы можете сначала посмотреть видео ниже, чтобы почувствовать его:
Официальный пример «Опыт звонков в реальном времени с помощью ИИ»
Так что же такого особенного в модели сквозных голосовых вызовов, разработанной Soul? Согласно официальному описанию, ее основные особенности включают в себя:
Со сверхнизкой задержкой взаимодействия
Быстрое автоматическое прерывание
Суперреалистичное выражение голоса
Способность эмоционального восприятия и понимания и т. д.
Возможность сверхнизкой задержки взаимодействия означает, что в тот момент, когда вы говорите, ИИ может ответить немедленно, без каких-либо задержек, а расстояние между вами и ИИ может быть сокращено в одно мгновение. Если вы хотите иметь с ним настоящее общение, вам вообще не нужно ждать, это как разговор с реальным человеком.
Большая модель голоса Soul поддерживает быстрое автоматическое прерывание . Другими словами, когда вы общаетесь с ИИ, если вы хотите его прервать, он может полностью понять, что вы имеете в виду, и легко прервать собеседника. Такой вид взаимодействия действительно интересен!
Наконец, в сочетании со сверхреалистичным выражением голоса и возможностями эмоционального восприятия и понимания , ИИ может не только понимать ваши слова, но также чувствовать ваши эмоции и давать соответствующие ответы на основе ваших эмоций.
Судя по официальному примеру видео, если эта функция будет полностью запущена в будущем, предполагается, что большое количество пользователей не смогут отличить реальных людей от виртуальных людей с искусственным интеллектом, когда они испытают ее в Soul.
Soul сообщила, что ее большая модель сквозных голосовых вызовов была применена к сценарию вызовов в реальном времени «Эхо другого мира» (в стадии внутреннего тестирования) и будет расширена до нескольких сценариев товарищества и взаимодействия ИИ, таких как ИИ. Гоу Дан в будущем.

Предполагается, что уже в 2020 году Soul запустила исследования и разработки технологий AIGC, сосредоточив внимание на исследованиях и разработках ключевых технологий, таких как интеллектуальный диалог, голосовые технологии и виртуальные люди, а также на глубокой интеграции этих возможностей ИИ в социальные сценарии.
В процессе использования искусственного интеллекта для улучшения социального взаимодействия Soul уделяет особое внимание достижению антропоморфного и естественного эмоционального опыта общения.
Чтобы улучшить эмоциональную обратную связь и общение с пользователями, техническая команда Soul уделила внимание проблемам эмоционального понимания и задержки. Они запустили самостоятельно разработанные модели генерации речи, модели распознавания речи, модели голосового диалога, модели генерации музыки и т. д., которые поддерживают генерацию реального тона, голосовой DIY, многоязычное переключение, многоэмоциональный захватывающий диалог в реальном времени и другие функции. Они уже использовались в нескольких сценариях Soul, таких как «AI Goudan», «Призрак оборотня», голосовое взаимодействие с искусственным интеллектом в реальном времени, «Эхо из другого мира» и т. д.
Самостоятельно разработанная модель сквозного голосового вызова Soul теперь доступна в сети, что означает, что пользователи могут наслаждаться более естественным взаимодействием человека с компьютером. В будущем Soul также планирует и дальше продвигать создание мультимодальных сквозных возможностей больших моделей, чтобы сделать взаимодействие между людьми и ИИ более интересным и захватывающим.
Обновление технологии искусственного интеллекта Soul на этот раз не только улучшает пользовательский опыт, но и предоставляет новые идеи для будущего направления развития «ИИ + социальные сети». Я верю, что в ближайшем будущем мы увидим появление более инновационных социальных приложений, основанных на технологии искусственного интеллекта, которые принесут больше удовольствия и удобства в социальную жизнь людей.