晴数智慧语音合成数据集助力中国Voice Engine语音大模型乘风破浪

2024-04-01 16:00:40     来源:

近日,OpenAI在官网首次展示了全新自定义音频模型“Voice Engine”。用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。

除了语音合成之外,Voice Engine还能提供视频翻译功能,可以将一种视频语音无差别的翻译成多国语言。此外,OpenAI首席技术官Mira Murati在前不久接受的采访时表示,未来Sora生成的视频会带声音的,很可能为其提供声音的就是Voice Engine。

我们可以期待voice engine在未来将有广阔的应用场景,包括:配合Sora视频生成的功能,为视频配音,赋能内容创作、教育和娱乐等领域;支持语音交互的个人智能助理。这类个人助理它不同于简单的语音合成或者语音识别,而是根据用户的输入进行语音的响应:用户可以通过文本、语音来输入,然后服务直接用语音回复结果。

从技术角度来说,传统的语音助理应该是先通过ASR识别用户的语音,然后转成文本,GPT再根据文本生成答案,再由TTS技术合成语音输出。这个分步系统最大的缺点就是时延以及准确性!三个步骤,每个步骤准确率90%,最终的回复准确率可能只有72.9%了!同时,在自然对话中,标准反应间隔时间约为300毫秒。如果这是一个语音端到端的模型(符合OpenAI当前的技术趋势),那么时延和准确性都值得期待!

所以,语音端到端技术,将从根本上优化人工智能和人类对话的效果和响应速度,成为未来AIoT的标配。在这项技术中,高质量的语音数据将是决胜关键

晴数智慧在去年全球首发了中文高质量复刻数据集,得到了广大企业的认可。今年我们再接再厉,为中国大模型落地各行业、并适配各地交流的刚需,再次首发“多方言超拟人语音合成大模型数据集”,助力中国Voice Engine语音大模型乘风破浪!

多方言超拟人语音合成大模型数据集具备48k高采样率,安静环境采集,方言语种多样,声音来源丰富,筛选来自不同地区、年龄、性别、社会背景人员录制以确保声音多样化。自由对话风格具有高表现力和情感色彩,能够使语音合成模型生成出方言语音更加生动、自然。主题丰富多样,涵盖了日常生活中的各种场景和话题,为精准、自然的语音生成提供了强有力的数据支持。

image.png

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

猜你喜欢

以爱心护童心,《蛋仔派对》给山区孩子带来关怀
今日头条上线《历史开讲·敦煌篇》,揭秘敦煌背后的众多传奇
从IT到AI替,2024合思春季产品发布会定档4月23日
合思严宇杰:探索AI、运用AI,让企业运营更智能、更高效
合思携手帆书(原樊登读书),共创效率与满意度“双赢”的财务数字化实践
深研弹性波 创新攀高峰 ——记南京航空航天大学航空学院钱征华教授
ESI集团与一汽-大众技术开发达成战略合作 共同推进智能仿真技术发展引领汽车行业新时代
中国快递协会召开会员大会 快递100新晋成为会员单位
Web3.0成未来趋势 欧科云链以强大实力助力香港Web3.0发展
同心共研做科学 且思且行且提升
开源现恶意代码,国产系统未受影响
平台聚力,生态绽放!2024致远互联生态伙伴大会盛大召开
戴尔存储解决方案Dell PowerScale:全球率先通过NVIDIA SuperPOD验证
斗象世界五百强客户案例巡礼之“漏洞运营管理”
千亿级金融集团“漏洞情报”深度运营与自动化实践
网易严选8周年《AI“心”机发布会》脑洞视频:严选好物 无限升级
深度融合!华为云亮相致远互联生态伙伴大会
云知声荣获国际人工智能顶会AAAI 2024数字人竞赛1亚1季
朱茵助阵,TimeShop发布新品“紫光宝盒”,擘画抗衰未来
纵行科技携ZETag亮相全球物流技术大会,荣获“物流技术装备推荐品牌奖”
天圆二代迭代更新,展现迅达厨电的卓越追求!
戴尔入围Forrester全球AI基础设施报告“领导者象限”
小牛电动酷炫亮相三亚响浪露营生活节,现场火爆如潮
AI PC 浪潮兴起 云电脑将迈入新阶段
科力普热烈祝贺丨晨光助力博鳌亚洲论坛十余载,再次成为大会指定文具供应商 晨光科力普祝贺 I 晨光再次成为博鳌亚洲论坛指定文具供应商
集聚元宇宙创新力量 “歌尔杯”第二届高校VR/AR挑战赛总决赛圆满落幕
「天工大模型3.0」将于4月17日发布 同步开源4000亿参数MoE超级模型
54岁手艺人在抖音电商实现“黔茶出山”
扎实推进数实融合 助力中小企业创新发展
国科微斩获2024中国IC设计成就奖之“年度最佳AI芯片”