很多人都幻想过拥有“分身之术”,而随着AI技术发展的日新月异,曾经的想象正逐渐走进现实。
近日,云知声基于最新合成深度学习技术打造的数字人解决方案正式上线——
只需一次3分钟真人素材录入,即可生成一个声音、动作自然,口型精准,多语种精通的数字人分身,最大程度满足客户在人机交互、虚拟IP、内容定制等活动中的广泛需求,助力提升品牌知名度和用户粘性。
3分钟视频,创建专属数字人
融合AI数字人视频生成算法、TTS等多种能力,云知声数字人解决方案利用3分钟真人视频素材,基于真实人类的外貌、动作、声音等特征,即可生成具有高逼真度的数字分身。
● 形象逼真
在超大规模多语种音视频训练数据的支持下,云知声数字人结合良好的网络结构和训练策略设计,实现语音到人脸运动的充分解耦,从而确保了模型的泛化性和稳定性,生成数字人外貌更真实,动作、表情更自然。
● 音色自然
声音克隆让数字人能够拥有与真人音色、发音风格高度相似的声音,情感合成让数字人实现多元情感表达,方言合成让数字人也能说方言外语……通过声音克隆、情感合成、方言合成等系列TTS技术,云知声让数字人拥有了更个性化、多情感、高质量的音色,为数字人的言语表达赋予了更多生命力。
多场景应用,助推行业智能化升级
针对客户多样化需求,云知声可提供定制化制作流程,有效保障服务质量和虚拟人定制质量,帮助客户轻松打造专属数字人形象,可适用于教育、电商、新闻等多场景。
● 数字人+教育
针对传统教育备课强度高、教学时间空间受限等痛点,由数字人担任“虚拟教师”,实现自动化教学,不仅能够解放教师的时间和精力,还能够根据学生需求进行灵活教学安排,让学习更自由更高效。
● 数字人+电商
数字人担任“虚拟主播”,可智能生成播报视频流内容,实现直播间7*24小时不间断直播,降低营销成本的同时,帮助品牌建设独具特色的直播场景,有效提升用户购物转化率。
● 数字人+新闻
将文本、语音等内容转化为以数字人形象为主的视频内容,不仅可以做到全时化、全场化在线播报新闻,更可以使用不同语种、方言进行同时的乃至跨场景的报道,打破时间、空间限制,提升新闻播报时效性、影响力。
下一步,云知声将依托山海大模型技术能力,进一步打造有记忆、有人设和性格,能够“复刻”人类思维方式的AI数字分身,实现与更多行业场景的深度结合,加速推进数字人技术的应用落地。