出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

在 AIGC 技术的推动下，视频生成模型领域正迎来创新的高潮。出门问问独立研发的数字人克隆及生成服务，以其领先的创新能力，提供了高度真实与生动的数字体验，吸引了众多用户的目光。目前，这一先进技术已经成功部署在出门问问的 AIGC 产品——「奇妙元」和「奇妙问」中，持续扩大其在行业内的影响力和用户基础。

出门问问数字人系统持续迭代

自出门问问启动数字人服务以来，其技术团队已经多次进行数字人系统的迭代更新。如今的第四代数字人系统——基于多尺度3D模型的WetaAvatar 4.0，通过整合「序列猴子」的强大文案生成能力以及「魔音工坊」的高质量语音合成技术，我们进一步强化了数字人的呈现效果，实现高度仿真的外观，同时还精心打造了生动的表情，媲美真人。

综合来看，在WetaAvatar 4.0中，不论是数字人进行讲话、唱歌或者静音状态，其表现均优于前代，技术指标Sync-C的数值普遍高于WetaAvatar 3.0，清晰度也相比上代有较大提升。

图片1.png

Sync-C (SyncNet Confidence)：使用预训练的衡量音画同步性的模型 SyncNet 计算的音画同步置信度。相同的驱动音频和驱动视频，数值越高越好。

TTS引擎MeetVoice Pro赋能数字人

在第四代数字人系统WetaAvatar 4.0中，用户提交文本后，系统将调用出门问问的TTS引擎MeetVoice Pro，该引擎基于大语言模型—「序列猴子」，支持产生清晰自然的语音输出。随后，这段语音被输入数字人系统，确保视频中的数字人物可以以精准的口型匹配、自然的面部表情及流畅的身体动作呈现。通过这种方式，我们将文本信息转化为一个高度真实的数字化视频，为用户提供视觉与听觉相结合的真实体验。

图片2.png

实时语音解析能力— 本技术能够即时准确地从语音音频中提取信息，并转换成可操控虚拟形象的音频信号。

精确的口型驱动能力 — 采用深度学习模型，将音频信号精准地转化为自然流畅的口型及面部动作，提供真实的视听体验。

领先的音频编辑能力 — 本系统整合了魔音工坊配音的核心功能，包含快速准确地调整多音字和韵律，以确保配音的专业水准，特别适合虚拟主持人等应用场合。

三大核心特色打造超真实数字人体验

WetaAvatar 4.0采用了一套先进的人脸重建与生成机制。首先，通过人脸重建模型捕捉到人脸的核心特征数据，这一数据反映了人脸的不变属性。然后，人脸生成模型使用这些基础数据，并结合具体的人脸图像及配套的音频信息进行处理，以此同步创造出与音频匹配的嘴型动作和表情。这项技术的应用确保了数字人的表现不仅仅是视觉上的逼真，还能在语音和表情的同步上达到极高的自然度，大幅提升了数字人的真实感。

图片4.png

全新升级后的第四代数字人系统具有“精致外观”、“迅捷响应”、和“多样选择”三大核心特色。

精致外观

利用最新数字人系统WetaAvatar 4.0，出门问问的数字人实现了前所未有的逼真还原。目前，数字人不仅拥有极大的真实感，嘴形与声音的同步精度也不断突破，带来了动态上的全新提升——让数字人的每一个微笑、每一次皱眉都宛若真人。

图片9.png

迅捷响应

最新数字人系统WetaAvatar 4.0基于强化的底层架构，极大提升了合成速度并显著降低了延迟。在普通消费级显卡上，系统能以0.3的实时率合成视频（即1分钟的视频仅需20秒左右）。同时，实时驱动延迟被控制在1秒内，大幅减少用户等待时间，实现流畅无缝的迅捷体验。

图片10.png

多样选择

出门问问倾力打造，旨在拓展数字人的多样性：从融合多音色、多语种的声音，到整合不同年龄和性别的人物形象，再到多角度、多动作的灵活展示，这一全新升级的数字人系统实现了质的飞跃，极大降低了数据集成的复杂度，为创建丰富多彩的数字世界提供了无限可能。

图片5.png

三大技术指标多方面综合提升性能

WetaAvatar 4.0系统的最新升级实现了多维度的重大突破，推动行业标准再上新高。本次升级的全面性能，可通过以下三个关键技术指标以及相应的demo展示进行深入评估与体验：

FID (Fréchet Inception Distance)

使用预训练的图像分类模型 Inception v3 网络抽取图像特征，假设特征向量的分布为高斯分布，计算真实图片序列和生成图片序列两个高斯分布的均值和协方差矩阵。通过测量两个概率分布之间的“距离”（相似程度）来评估生成图像序列与真实图像序列的相似程度。数值越低越好。

SSIM（Structural Similarity Index）

SSIM全称为结构相似性指数，是一种用于衡量两幅图像相似度的指标。它是一种全参考的指标，即它需要一张原始的图像作为参考。SSIM将图像的亮度、对比度和结构等因素考虑在内，通过比较这些因素的相似性来计算两幅图像之间的相似度。数值越高越好。

PSNR（Peak Signal-to-Noise Ratio）

PSNR全称为峰值信噪比，是一种常用于衡量图像或音频质量的指标。它是通过比较原始信号与经过压缩或处理后的信号之间的信噪比来评估质量的。数值越高越好。

图片6.png

根据综合指标测算和数据对比分析，得出结论：WetaAvatar 4.0在关键性能参数上相较于其前代系统取得了实质性进展。具体而言，在图像的真实感呈现、角色相似度的精确匹配，以及视频输出质量上，均体现出明显提升。

打造出更加人性化、情感丰富的数字伴侣

出门问问的技术团队持续探索创新，不仅将这一全套技术精益求精，更确保其在行业中处于领先地位，带给ToC和ToB客户前所未有的高质量数字人使用体验，速度与效果兼备。

出门问问AIGC产品——「奇妙元」与「奇妙问」现已全面集成我们最新一代的数字人系统。截至目前，「奇妙元」与「奇妙问」已上线超过200种数字人形象，并且我们正致力于对这些形象进行持续的优化迭代，以提供更优质的数字化体验。

出门问问的自研大模型「序列猴子」，其以语言为核心的能力体系，涵盖“知识、对话、数学、逻辑、推理、规划”六个维度。凭借「序列猴子」在跨模态迁移方面的出众表现，出门问问的技术团队推出了MeetVoice Pro语音大模型。此外，我们团队也计划利用「序列猴子」的核心能力，打造多模态数字人模型，进一步拓展和强化数字人的能力范围。

面向未来，出门问问将继续秉承深耕数字人技术的理念，逐步将其应用到更广泛的产品服务中。我们的目标是利用先进的智能技术，为用户打造出更加人性化、情感丰富的数字伴侣，可全天候提供陪伴。这将使人机互动变得更为自然，并将AI融入每个人的日常生活，引领智慧生活的新潮。

用户福利来袭

图片11.png

注册「奇妙元」后，

点击我的 - CDK兑换码，

输入兑换码：AIGC2024，

免费获得数字人合成时长。

标签：

猜你喜欢

中金公司以青云科技云原生能力激发业务新活力！

e签宝携手ACW，依托香港优势构筑全球电子签名服务新蓝图

鲁大师2024年手机Q1季报：骁龙天玑高端博弈，AI已成不可逆的大趋势

核污水问题迫在眉睫，安德利果胶解燃眉之急？

媒体观察：IBM踏上Al“开枝散叶”加速路

古琴吟诵，90后文学硕士通过直播打赏复活两大“绝技”

七猫免费小说鸿蒙原生应用核心版本交付，全场景阅读体验升级！

率先开通中国五星卡实名！腾讯游戏已支持多种证件实名验证

全线产品升级迭代！迅达集成灶矩阵震撼来袭！

驾校一点通鸿蒙原生应用Beta版开发完成，领跑驾考服务全场景时代

科研报国家奋进新时代 ——记江汉大学湖北省工程研究中心主任解明教授

华为手环9开启预售：全天候舒适佩戴，开启科学睡眠新体验

基于鸿蒙的兼容测试服务 Testin云测为行业打了样板

追觅科技x抖音商城开新日火力全开，助力品牌营销解锁新增量

全民音乐创作时代来临！火爆全网的「天工SkyMusic」上手指南建议人手一份

新壹科技CEO雷涛：AIGC助力文旅产业场景落地

共享数字时代的红利！《蛋仔派对》推动AIGC技术发展，让创作更轻松

“时光珠”高压氧舱：线下安全运行超8年，1.9ATA领衔民用抗衰科技

线下游客井喷，天水市博物馆、麦积山石窟抖音直播吸引超500万人次观看

众趣科技Qverse 三维空间云平台正式上线，赋能全行业三维数字化升级

其域创新发布Lixel CyberColor，为全球首个大场景3D高斯产品

光谷创业咖啡总经理李儒雄：小米汽车能成功的十二条理由

锐捷医疗全新亮相！全方案持续精进加速智慧医疗信息化进程

春风盛吹出海疾！530台安凯客车奔赴沙特

为未成年人保驾护航，《蛋仔派对》践行健康游戏

灰度认知社曹升：价格战怎么破局?

学魁榜纸上课堂新品上市，技术+服务结合，助力学生高效学习

Apache IoTDB 入选国家级规划教材《数据库系统概论（第6版）》

终身会员投影再出新品 1999元的天猫魔屏C2越级成3K以内最强投影

瑞熙恩电气成为洲际航天阿布扎比航天城—首批合作伙伴

热点图片

要闻

开封移动联合华为揭牌星光实验室:创新践行自智网络,加速发展新质生产力
4月3日,中国移动河南公司开封分公司(以下简称开封移动)和华为技术有限公司(以下简称华
“时光珠”高压氧舱：1.9ATA攀登民用抗衰科技巅峰
在古代的观念里,生物的寿命似乎都有一定的极限。但是,现代的科研进展让人类有望健康地
假日出行，普利司通电“静”高手助新能源车主舒心出行
春光明媚行，合当约踏青。小长假来临，正是自驾出游好时节。近日，普利司通（中国）投
2024专精特新企业数字化与新质生产力发展大会将于5月30日在上海举办
当前，随着新一轮科技革命和产业变革深入推进，发展新质生力，推动数字化转型已成为提
哲盛机械宣布入驻阿布扎比航天城
近日, 江西哲盛机械科技有限公司(以下简称哲盛机械)与香港上市公司洲际航天科技集团
蓝标传媒加入CAAC品牌出海生态委员会 | 为品牌出海保驾护航
近日，中国商务广告协会（以下简称: CAAC）授予蓝标传媒品牌出海生态工作委员会理事
富士胶片IBM超大规模数据智能化存储技术沙龙在北京顺利举行
2024年3月26日，"富士胶片IBM超大规模数据智能化存储技术沙龙"在北京IBM中国创新中心
RTX4060满性能释放 ROG魔霸7Plus电竞本9799元好价来袭
对于有着高性能需求的用户而言，搭载了NVIDIA GeForce RTX 4060的笔记本无疑是购机
山东迈际飞产业发展有限公司与洲際航天科技集團有限公司达成战略合作
在推动全球航天产业发展的道路上,洲際航天科技集團有限公司(USPACE)与山东迈际飞产业
PGYTECH将登陆美国NAB展会携神秘新品抢滩亮相
由美国广播电视设备制造商协会主办的2024全美广播电视展览会（2024 NAB），将于4月

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

相关阅读

猜你喜欢

热点图片

要闻