今年6月份铭顺科技,宣布发布全球首款“多姿态阿凡达数字人”,同时发布基于该模型的同名数字人工具和数字人克隆的本地安装包,这一举措标志着数字人技术进入多姿态、克隆无拘束、实时生成的新纪元。
铭顺科技的「多姿态阿凡达数字人」,以无限制动作克隆、全场景拍摄体验、电影级画质重新定义直播生产力!旧版数字人的“机械感”彻底终结,预示AI直播的“真人时代”正式开启!
与传统数字人训练需要数小时甚至数天的模式相比,铭顺数字人克隆实现了极限压缩,仅需30秒的视频,即可完成数字人形象和声音的克隆,合成4K超高清数字人视频。
传统数字人由于克隆技术的限制,克隆拍摄有众多限制,如人物必须正面、不能挡嘴挡脸、不能侧脸转身、不能有太多动作、不能多人出镜、也不能离开镜头等,否则就克隆失败,或克隆的数字人面部和嘴部出现模糊、变形、跳动、重影等现象,最终导致数字人效果不真实不自然不灵动,很容易被识别。
打破拍摄环境限制
在复杂光影、侧脸、遮挡等场景下仍能保证100%口型匹配,输出多表情多肢体动作数字人视频。
打破人物动态的限制
无论是行走运动、多人出镜、无人空镜、侧脸转身、甚至挡嘴挡脸,都能输出多姿态动作的数字人视频。
打破人物角色限制
数字人支持多人直播,支持多个人出现在直播镜头或场景里面。
该多姿态数字人大模型不仅极大缩短了数字人克隆训练及生产周期,大幅提升视频生产效率,同时在数字人画面口型精确性、表情演绎的自然度、动作的流畅度及整体视觉上均达到全球顶尖水平。
多姿态+多场景+电影级品质,铭顺数字人克隆按下“核按钮”。在直播场景中,铭顺数字人克隆支持无限时长的超高清数字人视频生成,能够通过语音或文字输入驱动,克隆后的数字人音色支持多种种语言输出,适用于95%的电商直播+本地生活直播场景,如服装、珠宝、美妆、美食、母婴、宠物、家电、房产、汽车等100+行业都能应用。
多姿态数字人,打破了单姿态数字人克隆限制,以更灵动的动作,更清晰的画质,以及秒级的响应速度和行业领先的精度,满足不同直播场景对高质量数字人的需求。凭借顶级口型同步技术,在复杂光影、遮挡或侧面角度下依然能实现高度逼真的发音匹配,使得数字人直播的自然度进一步提升,无限接近于真人表达效果。
铭顺多姿态阿凡达数字人的发布,不仅是技术能力的释放,更是推动数字人普及化、个性化发展的关键一步。
电影级品质的高清数字人主播,六大系统亮点击碎行业天花板,打造全球首个多姿态阿凡达数字人,重新定义直播标准:技术碾压,全面超越旧版
01 无限制动作克隆
● 支持行走、跑动、转身、跳跃等动态场景,甚至可模拟真人“手持产品挡脸”“侧身展示细节”等高阶动作
挡嘴挡脸:模拟真人主播手持资料或产品挡嘴挡脸的直播场景,支持数字人主播在直播中挡嘴挡脸进行直播。
侧脸转身:模拟真人主播在直播中侧脸和转身展示产品的直播场景,支持数字人主播侧脸和转身进行直播
行走运动:模拟真人主播前后左右走动或进行运动的直播场景
02 毫秒级音唇同步
● 逐帧语音对口型技术,配合深度学习声纹模型,确保每个字的口型、舌位、微表情与真人一致
03 多人交互场景自由切换
● 多人出镜:模拟真人多人直播场景,支持多个人出现在直播镜头或场景里面,且直播间数字人主播不会受到其他人的影响
● 双人换班:模拟真人直播间主播换班场景,支持一个数字人主播离开直播间,另外一个数字人主播进入直播间进行直播
● 单人离场:模拟真人主播临时离场产品的直播场景,支持数字人主播离开直播位置,侧身、后退或离开去换产品进行直播。
● 无人空镜:模拟无人直播和真人主播临时离场的直播场景,支持数字人主播离开直播间,直播间无人空镜直播。
多姿态数字人,只是开始
铭顺科技—多姿态数字人发布,数字人直播行业迎来了一个克隆无拘束的全新阶段,用户不再受限于克隆条件,而是可以在实现无拘束的数字人生成与应用,数字人能够实现更自然,更灵动,更鲜活。
结合私有化的部署模式,铭顺数字人克隆不仅适用于创业者和企业,也能在大型机构和企业级应用中发挥重要作用,为内容创作、品牌营销、教育培训、直播电商、虚拟主持等领域提供数字人技术。
铭顺科技多姿态数字人,不仅提高了数字人技术的应用标准,也为行业提供了一种标杆式AI应用模式。目前铭顺的AI元宇宙世界还在不断拓宽,多姿态的数字人,只是开始...
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。