一脑驱动多形:终端智能的 “硅基生命” 范式
“‘一脑多形’不是概念,而是落地的技术战略。” 联汇科技相关负责人在现场介绍,本次展出的核心载体 OmAgent 智能终端平台,正以 “统一大脑 + 多元形态” 的创新架构,精准响应千行百业智能化升级过程中存在的碎片化的需求痛点。
所谓 “一脑”,是指OmAgent 智能终端平台融合多模态大模型、空间智能等技术构建的核心能力中枢,可实现类人级的环境理解与自主决策;而 “多形” 则是基于这一 “大脑”,灵活适配机器狗、无人机、IoT 设备等硬件,快速衍生出工业巡检、商业服务等场景方案。
现场演示中,全自主机器狗 Sugar 成为 “一脑多形” 的具象体现:无需遥控即可全自主识别复杂地形、引导蒙眼观众避障,其背后正是 OmAgent 平台的 “感知 - 决策 - 行动” 全链路能力。多位行业观察者表示,这种架构突破了传统终端 “功能单一、算力依赖云端” 的局限,为智能终端规模化落地提供了可行路径,更是实现了AI能力的高效复用与规模化复制,真正降低了智能终端的开发门槛。

智能终端体验区,沉浸互动感受技术魅力
联汇科技A32展位还设置了智能终端的互动体验区,让观众在实操中感受终端智能的落地魅力。
全自主机器狗Sugar成为现场的明星之一。它能在复杂场景中完成自主导航、智能避障与指定任务执行。在现场设置的“智能导航挑战”环节中,观众蒙眼握持连杆,由Sugar全程引导前行。Sugar实时环境感知、自主决策等能力,让观众直观体验到了终端智能的可靠与自主。许多观众在体验后纷纷表示,这种智能导航技术有望在更多领域得到应用,为人们的生活带来便利。
端侧视频AI创作工具OttoBox AI Studio也吸引了众多内容创作者的目光。作为联汇科技最新推出的面向内容创作者的视频AI工具,它可以让观众上手操作,感受如何将海量素材高效管理,并通过AI能力快速完成智能剪辑、包装与导出。这一工具让复杂的视频创作流程化繁为简,实现了“灵感即刻成片”的创作革命。
此外,在张江科学会堂表演B区,联汇科技全自主机器狗Sugar还将在三天的时间里带来三场互动体验秀。
开源 + 社区:打开终端智能的 “共创大门”
在GDPS 2025的舞台上,联汇科技还集中亮相了VLM - FO1、OpenTrackVLA两项最新开源成果。
其中,VLM-FO1能够让大模型“精准指认”万物,作为一个即插即用(Plug-and-Play)的视觉-语言模型(VLM)增强框架,VLM-FO1 致力于弥合大模型“高层推理”与“细粒度感知”之间的鸿沟。它不仅赋予现有 VLM 强大的像素级定位能力,还完美保留了其原有的通用理解与推理能力。在精细化检测、个性化服务与流程自动化等核心商业场景拥有巨大的应用潜力。
OpenTrackVLA作为一个完全开源的视觉-语言-动作(VLA)系统,它让机器人仅凭普通的单目摄像头,就能听懂“保持距离跟随这位穿红色外套的访客”或“绕开障碍物靠近那辆白色货车”等复杂指令,并自主生成精准、安全的运动路径。这也意味着OpenTrackVLA在服务机器人、智能安防与柔性自动化等对动态交互要求极高的商业领域,具备了广阔的应用前景。
更受开发者关注的是 OmAgent 开发者社区的首次线下亮相。该社区由联汇科技发起成立,作为连接全球开发者、企业与科研机构的协作平台,该社区聚焦端侧芯片、人机协同等领域,将为参与者提供技术资源、项目对接等支持。据悉,12 月 13 日,OmAgent 开发者社区还将有重磅消息官宣,值得关注。
在AI技术加速向物理世界渗透的当下,联汇科技正在加速落地其“一脑多形,万物觉醒”的核心战略,其配套的项目开源、社区运营等组合拳,展现出企业从技术提供者向生态推动者转型的明确意图。
本平台所发布信息的内容和准确性由提供消息的原单位或组织独立承担完全责任
