Soul App推出端到端语音通话大模型,实现超拟人实时自然交互

2024-09-03 16:56:48     来源:

近日,社交平台Soul App(以下简称“Soul”)语音大模型再次升级,上线自研端到端全双工语音通话大模型,具备超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力等特点,能够直接理解丰富的声音世界,支持超拟人化的多风格语言,实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。目前,Soul自研的端到端语音通话大模型能力已上线旗下“异世界回响”实时通话场景(内测中),并将在后续拓展至AI苟蛋等多个AI陪伴、AI互动场景。

自2016年上线,Soul一直致力于以创新的技术方案和产品设计,实现社交体验的拓展。2020年,Soul启动对AIGC的技术研发工作,系统推进在智能对话、语音技术、虚拟人等AIGC关键技术能力研发工作,并推动AI能力在社交场景的深度落地。

以AI升级社交的过程中,Soul的技术重点之一是致力于实现拟人化、自然化情感陪伴体验。其中,声音是重要环节之一。作为传递信息和情感的重要媒介,声音最能在沟通中赋予“情绪温度”和“陪伴感”。特别是在社交场景中,情感化、低延迟、多风格、类真实的声音能力,可以打破“次元壁”,让线上社交尤其是人机互动中,也能实现真实生活场景聊天的自然流畅感和沉浸现场感,真正完成类现实生活化互动场景中的交互体验。

因此,为给用户带来更好的情绪反馈和陪伴感,情绪理解、延迟问题一直是Soul技术团队关注的焦点。

此前,Soul团队推出了自研的语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等语音大模型能力,支持真实音色生成、语音DIY、多语言切换、多情感拟真人实时对话等,目前已应用于Soul “AI苟蛋”、站内狼人游戏“狼人魅影”AI语音实时互动、独立新产品“异世界回响”等场景。

与国际最前沿的技术发展保持同频,Soul持续完善自身语音技术能力积累,创新AI社交应用体验。今年7月,在人工智能领域顶级的国际学术会议——国际人工智能联合会议(International Joint Conference on Artificial Intelligence,IJCAI)举办的第二届多模态情感识别挑战赛(MER24)上,Soul 语音技术团队于SEMI(半监督学习)赛道获得第一名,在国际赛事舞台上展现了Soul的前沿洞察和技术能力。

如今,自研端到端语音通话大模型的率先上线,再次证明了Soul在行业中扎实的技术能力积累。

区别于传统的级联方案,语音到语音的端到端建模,意味着语音交互体系的颠覆式升级,即不再需要从“语音识别、自然语言理解、语音生成”等多个环节流转,直接语音输入—语音输出的端到端模型能够最大程度实现信息无损传递,降低响应延迟时间。

此次Soul自研的端到端语音通话大模型便具备超低交互延迟、快速自动打断、超真实声音表达和丰富情绪感知理解能力的特点,支持更自然的人机交互体验。

在延迟方面,于实际应用过程中,用户体验与“异世界回响”中虚拟人实时语音通话效果时,延迟时间少于行业平均水平,真正实现即时的AI交流和陪伴。

值得一提的是,端到端的语音语义理解和响应以及更自然的语音指令控制,让Soul语音通话大模型不仅能够给予情感关怀、理解人声情绪情感并给出有温度的回应,还能够理解物理世界的声音场景,模拟物理世界动物声音、理解多人聊天内容,实现多风格语言切换、文艺内容创作和即兴演唱,接近现实交流互动场景需要。

接下来,Soul将持续推进多模态端到端大模型能力建设和应用落地,以AI辅助社交、提升关系建立的质量和效率的同时,构建人机交互新场景,让用户可以与AI进行更加有温度、沉浸、趣味的互动交流,不断创新社交体验。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

猜你喜欢

新疆交建发布首份可持续发展报告:建设美丽新疆,共绘可持续未来
Nativex 助力泰国王权免税店吸引中国游客,成功推动品牌增长
三星Galaxy Buds3系列:开学季采购清单上的必购好物
忆恒创源发布PBlaze7 7A40系列PCIe 5.0企业级SSD,4K随机写突破百万IOPS!
格创东智携AOI检测设备亮相智能装备行业技术研讨会,共探数字化转型新路径
国际版「数字风洞 Online」香港发布,永信至诚HKDWT香港「数字风洞」测评中心正式运营
EMIT依美可:解酒神器谷胱甘肽,安全有效“不肝悲”
运满满“接单抽百万现金”活动开奖 100万现金花落河北货车司机
数慧时空亮相2024中国地理信息产业大会 重磅发布数智云脑DIIF产品
金山云企业存储KingStorage-OBS升级混合云容灾方案
安博通再布局算力芯片,牵手江原科技深化算网安全合作
一键优化、高效创作,「WPS AI帮我改」提升办公生产力
现场直击 | 铁木牛机器人沙特仓储物流展实况
云南白药与钉钉签署深化合作协议,加深探索利用AI重塑医药产业
腾讯自选股携手汉仪股份联合推出创新与专业的金融字体
让拍摄无限轻松,猛玛为创作者再出发|品牌焕新
灵感匮乏遇到创作瓶颈 快用三星Galaxy Z Flip6的AI功能打开思路
9月20日,即将同期举办的两大国际盛会有多少种打开方式
香港城市大学(东莞)隆重开幕
久久公益节来啦!腾讯应用宝邀您一起关注网络安全文明
APUS岐黄大模型入围第二届全国数字健康创新应用大赛决赛
腾讯音乐娱乐集团推出国内首张阿尔兹海默病疗愈音乐公益专辑
硬科幻✖硬科技 《三体:远征》以技术升级赋能内容创新
“高精尖”锦纶打造新优势,永荣股份引领Future Nylon创新升级
享受创造,发现美好,老板聚划算欢聚日首开行业先河出海寻鲜
vivo“童画未来”:厚植科技土壤,让美育之花在乡村绽放
下一本书,阅读星辰和大海|在Soul,看见更大的世界
格创东智亮相elexcon2024,带来AI+智能制造新“配方”
咸阳高新区携手新华三聚力提质,打造新质生产力服务平台
经济日报:普通电工抖音维修电路卖出百万件工具,直播电商撬动更多生意