近日,国家互联网信息办公室联合多部委公布《生成式人工智能服务管理暂行办法》(以下称《办法》),自2023年8月15日起施行。网信办有关负责人表示,出台《办法》,旨在促进生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益。
通过《办法》规范生成式人工智能产业发展,是对生成式人工智能巨大潜力的重视和定调。自ChatGPT今年初红遍全球,国内随即爆发“百模大战”,面向生成式人工智能的大模型多如过江之鲫。互联网公司、云公司、人工智能公司、游戏娱乐公司、电信运营商、通信设备商……产业界看到了变革经济社会的历史性机遇。
其中,在大模型技术创新的驱动下,以人形机器人为代表的具身智能,重燃了产业界、资本市场对AI的强烈关注和乐观预期。随着技术和应用场景的不断突破,作为通用人工智能的最佳载体,机器人产业智能化和商业化落地的最佳路径,经过云端大脑赋能的人形机器人已经成为科技业最新的“风口”。
具身智能时代:人形机器人站上舞台中央
在发布《办法》前,官方已经注意到人工智能技术的巨大价值,国家发改委将其列为15个战略性新兴产业之一。与此同时,政策也加大了对机器人产业的支持:2022年12月,工业和信息化部、国家发展改革委等15部门正式印发《“十四五”机器人产业发展规划》,提出“到2025年,我国成为全球机器人技术创新策源地、高端制造集聚地和集成应用新高地。”
今年6月,北京市人民政府印发《北京市机器人产业创新发展行动方案(2023—2025年)》,以求加快推动北京市机器人产业创新发展,打造全球机器人产业高地。方案计划组建北京市人形机器人产业创新中心,采取“公司+联盟”模式,由龙头企业牵头,通过整合创新资源,建设人形机器人研制基础条件,解决产业共性急需,加速人形机器人产品研制和推广。
此外,深圳、上海等城市先后出炉了机器人产业支持政策。两类产业政策的交汇点,指向了今年登上舞台中央的明星:具身智能。
具身智能,是指拥有身体并支持物理交互的智能体,具备感知、思考、学习、决策等能力,能够与环境进行交互,标杆产品是人形机器人,受到马斯克、黄仁勋等国际产业大佬的追捧,例如特斯拉在去年发布了人形机器人“擎天柱”。在国内,达闼引领人形机器人产业潮流。
本月初举办的WAIC 2023世界人工智能大会上,特斯拉、达闼、傅里叶智能等公司的人形机器人产品引爆全场。灵活的走位、强大的智能,让产业界很快意识到了具身智能在千行百业应用的巨大潜力。
尤其是达闼展出的人形机器人,在现场不仅与观众互动时“有问必答”,知识渊博,还表演了《千手观音》,扮演了“灌篮高手”、“咖啡大师”,展现出令人震撼的智能、动作的协调,被热情的观众众星捧月,并“送上”了抖音同城热搜榜榜首。
其实,达闼创始人黄晓庆早在创业之初就预见到,人工智能+机器人,将是实现机器人产业智能化和商业化落地的最佳路径,并开创性的提出了“云(云端大脑)-网(安全网络)-端(机器人终端)”架构的全新技术体系。从今年来看,这一判断正照进现实,以人形机器人为代表的具身智能,已经站到了舞台中央。
大模型加速具身智能:人形机器人照进现实
具身智能产业发展的一大关键,是人形机器人的行为举止“越来越像人”,智能化程度不断提升。大模型技术的应用,将具身智能推进了一大步。政策+技术双重催化,让具身智能在今年一鸣惊人。
仅有大模型技术的创新,不足以驱动具身智能发展。香港大学教授席宁认为,“计算机控制机器人必须解决这三个问题:逻辑关系、特殊关系和时间关系。然而,现有的大型语言模型(LLM)等方法,只能回答其中一个维度的问题。”北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军也表示,ChatGPT只是数据驱动的静态智能,未来是时空环境驱动的具身智能,智能载体不是今天的人工神经网络,而是类脑的脉冲神经网络。
达闼指出,这需要多模态(文本、语音、图片、视觉、运动、点云等)融合感知、认知、决策和行为生成能力,并基于人工反馈的强化学习完成并快速智能进化。达闼本月发布业界首个机器人多模态大模型RobotGPT,正是长期耕耘云端机器人与GPT技术结合的集大成之作。
达闼研发了通用人工智能平台——海睿AGI平台,基于海睿AGI平台和海量机器人数据积累,训练出了RobotGPT。RobotGPT以多模态Transformer为基础,实现机器人理解人类语言,自动分解、规划和执行任务,进行实时交互,完成复杂的场景应用,推动具身智能的自主进化,让云端机器人成为通用人工智能的最佳载体。
基于这一能力,达闼可以为客户定制 GPT,包括开放的GPT、开放基础上定制和调优GPT、帮助客户自主训练和调优GPT三种模式,实现机器人由单任务向多任务,从单模态向多模态,轻松完成各类复杂的操作。
产学研各界都在加快研究。近日,斯坦福大学李飞飞团队也公布了具身智能的最新研究成果:VoxPoser,即大模型接入机器人,把复杂指令转化成具体行动规划,人类可以随意地用自然语言给机器人下达指令,机器人也无需额外数据和训练。马斯克认为,未来人形机器人的市场或将远超智能汽车行业,现在是推进研发人形机器人的绝佳时机。据悉,特斯拉的人形机器人擎天柱,未来将能够在特斯拉的高级辅助驾驶系统软件和计算机上运行。
大模型驱动的具身智能,有望在未来成为机器人厂商的标配。包括戴森等产业巨头在内的大量玩家争相入场。数据显示,2022年,中国机器人行业累计发起358起投融资,其中亿元级别融资高达112起。“连更看好软件的美国资本市场,今年也出现了5家研发人形机器人的公司,行业热度可见一斑。”黄晓庆感叹。
行业应用发轫:人形机器人将开启十万亿市场空间
大模型技术的最大价值,是赋能垂直行业应用,这一判断已成为产业界越来越广泛的共识。因此,一些通用大模型也在努力面向垂直行业场景应用优化,避免沦为简单的“聊天工具”。
以人形机器人代表的具身智能,更是天然面向垂直行业市场应用。在大模型技术——尤其是RobotGPT这类基于通用人工智能平台训练的、面向行业应用的大模型加持下,将成为人类社会的重要帮手。
服务性场景和行业已经率先开展应用。从全球范围来看,很多发达国家都面临严重的人口老龄化问题,中国人口也正在老龄化。人口老龄化意味着服务性岗位的人力资源短缺,人形机器人可以很好的弥补。可以看到,各地政策对机器人的行业应用场景进行了具体而微的细化,以更好、更快地服务行业发展需要。
例如戴森,其目标就是研发会做家务的人形机器人。“中国人口老龄化程度较高,随着人工智能行业的快速发展,人形机器人应用场景广泛,市场渗透率仍有较大提升空间,市场前景广阔。”中航基金副总经理兼首席投资官邓海清接受媒体采访时指出。
据麦肯锡的报告,到2030年,全球约有4亿个工作岗位将被人形机器人取代。按20%渗透率和15~20万人形机器人单价来测算,全球人形机器人市场空间可达12万亿元~16万亿元。
众多玩家中,达闼无疑独树一帜。该公司不仅拥有行业唯一的云端机器人国家新一代人工智能开放创新平台,更是产业链全局,在大模型、AI、5G、多模态等领域拥有丰厚的技术积累,机器人相关专利申请位居世界第一。其定位是成为“云端机器人运营商”,推动机器人走向行业、走向大众、走向普及。
基于人工智能技术的融合,黄晓庆还有一个著名的判断:机器人是人类社会继PC、智能手机之后的“第三台计算机”。可以说,具身智能的时代,才刚刚开始,未来十年,作为具身智能的终极形态,人形机器人将有巨大的发展潜能。