“自动驾驶攀峰要经过“可行、可靠、可商用”三个阶段。”6月6日,2023世界智能驾驶峰会在北京召开,毫末智行COO侯军受邀参会,进行了《“可行、可靠、可商用”的自动驾驶解决方案探索与规模落地》的主题分享。侯军指出,可行阶段指初步具备一些感知、算法和车辆控制能力,小范围进行测试运营;可靠阶段,要全面保障安全性、车规级、全天候、全地形四要素;可商用则是指要能符合场景的需求,提升规模降低成本并且要有政策法规的支持。此外,他强调任何公司都承担不了数百万4D Clips的标注成本。利用DriveGPT的自动化标注能力,可以降本98%。
(毫末智行COO侯军进行主题演讲)
作为国内目前唯一推动5G通信领域与智驾科技企业跨界交流与合作的平台,2023世界智能驾驶峰会以“5G大时代,勇闯无人区”为主题,聚集了包括中国汽车工程学会名誉理事长付于武、滴滴自动驾驶COO孟醒等主机厂、移动出行、操作系统、芯片、激光雷达等40多家企业,近100多位产学研代表,共同探讨5G与智能驾驶、无人车、车载芯片的发展合作。
演讲中,侯军介绍,自动驾驶成功最核心的问题,不仅仅是技术本身,而是企业机制。首先位于顶层的人工智能包含三项基本要素即大模型、大数据和大算力。对于科技公司来说大数据是目前面临的最大挑战。往下看企业的机制和人才获取是上层三要素能否聚集的关键。最底层则是认知的一致,有了强大的认知才能把上面的差异和关键点统一结合起来。
经过多年的发展,自动驾驶经历了以硬件驱动为主的1.0时代、以软件驱动为主的2.0时代,目前正在进入由数据驱动的自动驾驶3.0时代。数据智能方面,毫末打造的中国首个数据智能体系MANA,学习时长已超62万小时,相当于人类司机的7.5万年。有了数据智能体系的加持,毫末得以利用成本和规模的优势,不断持续落地自动驾驶产品。
大模型方面,毫末于2023年4月11日正式推出了行业首个自动驾驶生成式大模型 DriveGPT,中文名“雪湖·海若”。作为生成式大模型,DriveGPT的运行需要大量的数据作为基础。目前,毫末DriveGPT已经完成基于5000万公里驾驶数据的训练,参数规模达1200亿。DriveGPT雪湖·海若的底层模型采用GPT(Generative Pre-trained Transformer)生成式预训练大模型,不过与ChatGPT使用自然语言进行输入与输出不同,DriveGPT输入是感知融合后的文本序列,输出是自动驾驶场景文本序列,即将自动驾驶场景Token化,形成“Drive Language”,最终完成自车的决策规控、障碍物预测以及决策逻辑链的输出等任务。
另外毫末在使用数据过程中,逐步建立起一套基于4D Clips驾驶场景识别方案,目前自动驾驶数据包含三种形态,分别为Frame(单视角单帧数据)、Bundle(环视单组数据)以及4D Clips(环视连续数据Clips)。三种数据的单位规模达到了1:30:3000-10000。
如果使用DriveGPT雪湖·海若的场景识别服务,一张图片的价格将由5元下降到0.5元,单帧图片整体标注成本,仅相当于行业的1/10。“任何公司都承担不了数百万4D Clips的标注成本。利用DriveGPT的自动化标注能力,基本上可以降本98%”毫末DriveGPT雪湖·海若已开启对限量首批生态伙伴的开放合作,北京交通大学计算机与信息技术学院、高通、火山引擎、华为云、京东科技、四维图新、魏牌新能源、英特尔等高校与企业加入。2023年1月,毫末还发布了中国自动驾驶领域最大智算中心MANA OASIS(雪湖·绿洲),每秒浮点运算达67亿亿次,全面保障毫末大模型训练的稳定性、效率和速度提升。
演讲最后侯军表示,自动驾驶今天已经进入了规模商用的阶段,“我们希望以客户为中心,进行全栈共创开放合作,提供全栈解决方案、云端服务、硬件、软件、模块、原型代码 6个产品层面的合作方式。你的灵魂你保留,我的灵魂你带走,全力助力我们的客户更上一层楼。”
成立三年多,毫末智行已成为中国自动驾驶公司量产第一名。在乘用车领域,毫末Hipilot已搭载近20款车型。毫末打造的中国首款可大规模量产落地、重感知城市NOH,已在北京、保定、上海等城市开启泛化测试,到2024年将有序落地100城。在末端物流无人配送领域,近期重磅发布的小魔驼3.0是毫末第三代末端物流自动配送车,也是全球首款9万元内中型末端物流自动配送车。小魔驼3.0适配灵活,容量大,可以满足在物流,商超、零售等众多场景的需求。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。