声网入选36氪「WISE2024商业之王年度最具商业价值企业」

11月27日，36氪重磅发布「WISE2024 商业之王系列年度企业名册」，声网凭借在实时互动领域的深厚技术积累、专业的客户服务以及在生成式 AI 时代的技术创新，成功入选「WISE2024 商业之王年度最具商业价值企业」。

作为中国最具社会影响力的年度行业峰会之一，36氪 WISE 大会始终站在时代前沿，被誉为前瞻中国商业经济的风向标。今年10月，36氪特别启动调研，聚焦发掘那些为产业长期发展、全球经济增长提供创新动能的代表企业，设置了「WISE2024 商业之王年度最具商业价值企业」、「WISE2024 商业之王年度最具商业潜力企业」两大类别及九大新经济领域。经过对数百家提报企业的数轮遴选，结合专业分析师意见，正式发布了「WISE2024 商业之王系列年度企业名册」。

以生成式 AI 为代表，提“智”增效的数字化转型，持续向全行业深度覆盖。声网是全球实时互动云行业的开创者和引领者，为包括社交泛娱乐、教育、IoT、企业协作在内的20余行业赛道，200多种场景提供 RTE 服务。一直以来，声网都始终对 AI 技术保持敏感，并持续跟进，借助 AI 技术，提升实时互动体验，让实时互动场景变得更加丰富。

几年前，声网在业内首次将 AI 算法全面引入 RTC 技术栈的各个领域，用于改善音视频体验与 QoE 体验。在音频领域，声网打造了新一代实时音频技术智能引擎“凤鸣AI引擎”，其中的 AI 降噪、AI 回声消除、空间音频等能力给实时互动场景带来了更加纯净和沉浸的听觉体验。在视频领域，声网的“实时高清·超级画质”解决方案，在全面提升视频画质的同时，也带来了 AI 美颜、虚拟背景、AI 驱动表情与动作等方面的体验进化。

自2023年以来，声网持续不断地探索生成式 AI 与 RTE 能力相结合给不同行业带来的应用场景创新与效率提升。如今，随着多模态大模型技术的发展，能以语音与人类进行自然对话的多模态 AI 将在客户服务、教育和健康等多个场景中得到广泛应用，而声网则有望成为对话式 AI 的关键基础设施。

在10月25日举办的第十届实时互联网大会上，声网正式发布了 RTE+AI 能力全景图，从实时 AI 基础设施、RTE+AI 生态能力、声网 AI Agent、实时多模态对话式 AI 解决方案、RTE+AI 应用场景五个维度，清晰呈现了当下 RTE 与 AI 相结合的技术能力、架构方案与应用场景。RTE 已经成为生成式 AI 时代 AI 基础设施的关键部分，而 RTE 与生成式 AI 结合所带来的场景创新，也将成为下一个十年的主题。

声网对话式 AI 解决方案 构建实时多模态 AI 语音交互

声网通过与多家客户在 AIGC 场景的深度合作，探索出了实时多模态对话式 AI 解决方案，该方案以语音为核心，支持视频扩展，可实现文本/音频/图像/视频的组合输入&输出，通过丰富的功能构建真实、自然的 AI 语音交互体验。

实时多模态对话式 AI 解决方案具备四大优势：对交互延迟进行优化，延迟可做到低于500ms；支持 AI 降噪、背景人声过滤，让语音对话更纯静；支持随时打断与超拟人化人声合成，让对话更智能与逼真；同时还支持灵活可扩展的 AI Agent 架构等一系列功能，帮助开发者与企业快速构建适配自己业务场景的 AI 实时语音对话服务。

在多模态大模型的趋势下，RTE 成为了人与 AI 交互中的重要一环，越来越多的企业与开发者都在探索在大语言模型或者 AI 应用场景中快速集成高效的音视频能力。对此，声网推出了 Linux Server SDK，支持当下大模型编程最主流的两类语言 Python 与 Go ，企业可基于声网 Linux SDK ，快速接入大模型，上线具备 RTC 传输能力的 AI 应用场景，如 AI 陪伴、AI 助理、AI 语言陪练和 AI 客服等。AI+会议协作、IoT、教育 重塑实时互动体验

会议协作领域，声网的 aPaaS 产品“灵动会议”，通过 RTE 技术与生成式 AI 能力的融合，重塑会议协作使用体验，为客户提供低代码视频会议平台，并且采用了多云、多平台设计，提供 SFU+MCU 混合架构部署能力，支持客户进行灵活部署和扩展，全面满足客户会议、协作和调度需求。

RTE 技术确保了低延迟、高质量的音视频传输，让视频会议沟通更加实时流畅；而生成式 AI 则通过对会议内容的分析和生成，提供智能化的辅助功能，如实时字幕、AI 会议纪要等。两大技术支撑，让会议从传统的信息传输工具升级为智能协作平台，有效提升了会议效率和用户体验。

IoT领域，在实时多模态对话式 AI 解决方案的基础上，声网针对 IoT 行业的特殊性，探索出了 AI x IoT 智能硬件解决方案，该方案能够在低功耗、低算力芯片上快速实现大模型的接入，具备低延时实时互动、低成本灵活适配的特性，通过丰富的功能在智能硬件场景中构建真实、自然的 AI 语音交互体验。目前多模态大模型在智能硬件场景的落地主要以智能眼镜、智能手表、智能耳机等穿戴式设备为主，在生成式 AI 的趋势下，还出现了智能陪伴机器人、智能儿童毛绒玩具、智能戒指等一系列场景，带来不同硬件终端下的 AI 语音交互体验。

教育领域，声网 RTC+AI 教育超级双擎解决方案，通过 RTC+AI 双引擎驱动在线课堂教学体验的升级以及教学场景的创新，该方案包含了超强互动、丝滑流畅、多维直播、教育硬件适配、AI沉浸课堂、大模型辅助教学等六大特性。可应用于直播大班课、智慧教室、学习机、AI口语老师等在线教育场景。支持大模型辅助教学，运用大模型构建 AI 口语老师场景，学生可通过实时语音与 AI 进行问答互动，从学生发言到 AI 对话响应延时可做到低于500ms。

未来声网也将持续聚焦，打造一个更高效、更灵活的组织，更敏捷的抓住市场机遇，并打造生成式 AI 时代的下一代实时互动技术，巩固声网在实时互动领域的领导地位。

免责声明：市场有风险，选择需谨慎！此文仅供参考，不作买卖依据。

声网入选36氪「WISE2024商业之王年度最具商业价值企业」

相关阅读

猜你喜欢

热点图片

要闻