从数字人到元宇宙,从AIGC到Agent应用,数字人作为3D化、可视化的交互载体,经历了一轮生成式AI模型的创新大爆发,将赛道广度不断拓宽。
随着平台AI能力增强,以及数字技术的不断演进,虚拟人业界翘楚中科深智放手施为,应用阿里云AI开源模型、音色克隆能力、ECS云服务器和OSS对象存储等资源,将一个个“脑洞”快速落地,屡屡带来惊艳之作。
短短几年间,各大平台的电商用上了数字人主播,它们能够24小时不间断工作,还有实时调优的营销智慧。3D数字人为交互主体的沉浸陪伴式游戏也在海外悄然兴起,类型覆盖了RPG、养成等多种游戏,使游戏内的角色更加自然,游戏流程更加顺畅,在游戏行业掀起了一场“AI革命”。2023年云栖大会上出现了数字人“少年李白”,立体呈现诗仙的绝代风华。
中科深智与阿里云的合作,还将数字人技术的开发与落地大幅降本增效,成功加速技术应用的商业化进程。本期「看见新力量」栏目采访了中科深智创始人兼CEO成维忠,由他亲自揭秘这趟加速创新之旅。
从数字人主播到企业专有GPT
自2016年创立,中科深智经历了数字人行业的拓荒之旅,技术路线也从动作捕捉为主,升级为具备动作表情、声音和AI“头脑”的数字人。阿里云不断支撑着中科深智进行各种各样的尝试,也见证了数字人的持续进化。
2021年初,中科深智公布获得金沙江创投领投的数千万A轮融资。当时代表性的产品“自动播”正在帮各大电商平台用户实现7*24 小时AI自动直播卖货。
现在,随着AI大模型时代到来,中科深智的「云小七交互数字人一体机」已成为一款结合了先进技术的人工智能设备,它集成了识别式人工智能、生成式人工智能和大语音模型等技术,为用户提供智能交互体验。
成维忠表示,不同于传统互联网应用,实时动画和虚拟直播产品技术流程长,涉及到人机交互、实时渲染以及各类AI动作、图像处理技术,不能简单走系统集成路线。
助力「云小七交互数字人一体机」进行语言推理理解的,正是阿里云AI开源大模型。成维忠告诉「看见新力量」,过去中科深智尝试应用海外的开源模型解决英文交互问题,现在用阿里云的AI开源大模型可以实现替代。而且,在AI大模型支持下,“云小七”交互数字人不仅能进行多轮对话,更有一定的逻辑推理能力,还支持多语言,推理速度还很快。
成维忠表示:“阿里云可以便捷地支撑我们的产品”,中科深智也由此打开了为各个企业搭建企业专有GPT的市场空间。
数字人直播效果持续升维
在直播带货领域,中科深智沿袭不断升维的技术路线,打造了AI数字人直播带货产品「全能智播」,特别强化了数字人与用户的语音交互能力,还升级了AI数字人的场控能力。
「全能智播」的语言模型同样使用的是阿里云的AI开源大模型。目前「全能智播」可以为商家提供高效的答疑服务,特别适合同时在线20-30人的商家,为他们提供实时交互能力,提升用户满意度。
「全能智播」场控能力大幅提升,可以实时分析直播间的弹幕内容,根据用户需求调整实时解说策略,为商家高效打造全天候、全方位的直播解决方案,大幅提升生产效率。
此外,中科深智还应用了阿里云的音色克隆能力,可以利用少量声音,就快速克隆用户音色,实现音色逼真、韵律自然的AI复刻效果。高保真还原音色还能满足各类场景,满足短视频、教学视频、广告宣传等各类数字人视频制作的要求,大大降低了声音定制的成本。
由阿里云全面加持的「全能智播」,为用户提供个性化的交互体验,电商客户可以为直播大幅降本增效,重构直播场的经营模式。
虚拟人业务中台带来惊艳的数字人“李白”
中科深智最新的成果Motionverse是一款多模态实时驱动虚拟数字人的业务中台,主要面向有二次开发能力的行业开发者,用AI动态生成的方案,提供SDK和管理后台,解决产品和终端的虚拟数字人驱动问题。
阿里云ECS云服务器和OSS对象存储是这项业务的强力辅助,提供了安全可靠、弹性可伸缩的云计算服务,让中科深智不需要自建机房和采购IT硬件。“这帮我们节约了大量的服务上云成本”,成维忠提到,中科深智的服务文件利用OSS,使用了文件下载、上传等一列服务,通过简单的HTTP API就便捷地集成到了系统中,让公司用很低的成本,就完成了资产的缓存加速。
这一系列突破,帮助中科深智不断满足虚拟人业务的用户越来越复杂多变的需求,营收规模也达到了数千万量级,而中科深智与阿里云的合作也越来越深入。
2023年云栖大会上,中科深智携手央博和阿里云推出了“全球首个李白数字展”,其中的关键技术就是对于Motionverse的应用。“声台形表”兼具、还流露出性格特征的“少年李白”,为业界带来了数字虚拟人的惊艳体验。
成维忠告诉「看见新力量」:“这次合作带来的传播效应对我们帮助很大,还拓展了团队对于企业运营推广的思路。过去,团队总是觉得把底层技术做好就行了,现在发现,对于同样的技术,不同的视觉呈现和IP内容,会展现出完全不一样的场景效果。同时,与IP和平台的携手,大大增强了客户对于虚拟人的信心,让他们看到了中科深智技术真实落地带来的震撼。许多IT企业已经找到中科深智讨论合作的可能性。”
与阿里云的携手创新之旅,让成维忠坚定了最初的创业方向,更加专注生成式AI虚拟人和3D AIGC技术。
“3D虚拟人本身是XR技术(扩展现实)和AI技术的融合”,成维忠告诉「看见新力量」,AI语言大模型的产品本身就在发展交互形式,从最早的文本交互到语音交互,到现在对话式、拟人式的交互,不断升维,未来也将出现人和虚拟人之间的交互,走向NUI自然用户界面交互的方向。
“未来,AI无所不在”,成维忠相信,虚拟人与AI的融合,将催生新的人机交互、视频生成等大体量业务,而这些业务也肯定将深植云端,中科深智和阿里云合作还会带来更多的新可能。
创始人介绍:成维忠,中科深智创始人兼CEO
中国科学技术大学物理系半导体专业本科、复旦大学世界经济研究所研究生;生成式AI虚拟人和3D AIGC领导者,具有极强的市场敏感度和战略布局能力。曾任职中兴通讯、光明乳业、北纬科技等上市公司高管,也曾多次创业,在通信、互联网、电商、游戏、新媒体营销等领域都有丰富的实战经验。
2016年,与中科大校友创始团队一起创立中科深智,立足虚拟人领域,聚焦多模态大模型的生成式AI领域的技术研发,提供元宇宙和虚拟人全栈式解决方案服务,并与团队一起推出自研的CLAP大模型算法和Motionverse虚拟人业务中台,同时开发了系列3D AIGC产品,是生成式AI领域的爱好者和践行者。