让机器更智能,爱芯元智AX650N端侧与边缘侧Transformer部署实践

2023-05-30 14:36:31     来源:

近来,ChatGPT成为社会各界关注的焦点。从技术领域看,ChatGPT的爆发是深度学习领域演进、发展和突破的结果,其背后代表着Transformer结构下的大模型技术的飞速进展。因此,如何在端侧、边缘侧高效部署Transformer也成为用户选择平台的核心考量。

2023年3月,爱芯元智推出了第三代高算力、高能效比的SoC芯片——AX650N,依托其在高性能、高精度、易部署、低功耗等方面的优异表现,AX650N受到越来越多有大模型部署需求用户的青睐,并且先人一步成为Transformer端侧、边缘侧落地平台。

Transformer是当前各种大模型所采用的主要结构,而ChatGPT的火爆让人们逐渐意识到人工智能有着更高的上限,并可以在计算机视觉领域发挥出巨大潜能。相比于在云端用GPU部署Transformer大模型,在边缘侧、端侧部署Transformer最大的挑战则来自功耗,这也使得爱芯元智兼具高性能和低功耗特质的混合精度NPU,成为端侧和边缘侧部署Transformer的首选平台,而其优越性能则决定了Transformer的运行效果。

作为人工智能视觉感知芯片研发及基础算力平台公司,爱芯元智始终致力于让更多的实际应用落地。目前大众普遍采用的Transformer网络SwinT,在爱芯元智AX650N平台表现出色:361 FPS的高性能、80.45%的高精度、199 FPS/W的低功耗以及原版模型且PTQ量化的极易部署能力,都让AX650N在Transformer的落地中有着领先的优势地位。

具体来看,361帧的高性能,可媲美汽车自动驾驶领域基于GPU的高端域控SoC;而80.45%的高精度成绩同样高于市面平均水平;199 FPS/W的速度则充分体现出低功耗的特点,对比于目前基于GPU的高端域控SoC,有着数倍的优势;更为重要的,AX650N部署方便,GitHub上的原版模型可以在爱芯元智的平台上高效运行,不需要对模型做修改,亦无需QAT重新训练。与此同时,AX650N支持低比特混合精度,用户如果采用INT4,可以极大地减少内存和带宽占用率,达到有效控制端侧、边缘侧部署成本的目的。这些特性都保证了AX650N作为人工智能算力平台,最终落地效果更好用、更易用,且大幅提升了用户效率。

目前,AX650N已适配包括ViT/DeiT、Swin/SwinV2、DETR在内的Transformer模型,在DINOv2也已达到30帧以上的运行结果,这也更便于用户在下游进行检测、分类、分割等操作。基于AX650N的产品目前已在智慧城市、智慧教育、智能制造等计算机视觉核心领域发挥出重要作用。

接下来,爱芯元智AX650N将会针对Transformer结构进行持续优化,并且探索更多的Transformer大模型,例如多模态大模型,不断让Transformer在爱芯元智平台上得到更好的落地效果。值得一提的是,爱芯元智还将推出相应开发板,满足开发者对Transformer深度研究的需求,探寻更丰富的产品应用。

“爱芯元智将继续努力打造基于芯片+软件的端侧、边缘侧人工智能算力平台,让智能落实到生活的真实场景,最终实现普惠AI造就美好生活的企业愿景”,爱芯元智创始人、CEO仇肖莘女士表示。未来,爱芯元智将在成为人工智能算力平台型公司的道路上继续探索,加速基于Transformer的大模型在端侧、边缘侧落地的节奏,让普惠智能真正落地生根,开花结果。

标签:

猜你喜欢

UCloud优刻得参加首届中国算力网大会,展示大模型服务和绿色数据中心实践
中国原创可观测性平台DeepFlow入选SIGCOMM 2023
VAIO“标配”款,不会出错的PC新选择 ——VAIO F14•F16国内上市
“数智时代”奔涌而来 首澳智能勇立潮头
荣耀多款新品加入618大促:荣耀MagicBook 14系列仅售4999元起
250台AMR机器人助力英国零售巨头NEXT,实现拣分一体高效作业
薪龙网单地拟投资最高2亿元,搭建区域数字化用工平台
Tech星球AIGC产品TOP 25发布:一帧秒创登AI影像制作赛道榜
纳芯微助力汽标委LIN收发器芯片标准制定,推动汽车芯片产业高质量发展
湖职附属惠济医院与北京传山医疗科技有限公司合作共建签约暨揭牌仪式举行
美商海盗船发布iCUE LINK智能组件生态系统——颠覆性创新开启 PC DIY新时代
中国保险业面临人才结构性短缺,力码科技马经纬:科技让保险更“懂”用户
湖南省顶级中学长沙一中引入有道词典笔,探索智慧学习新方式
乐播投屏 x 网易云信丨拥有5亿+用户的国民级投屏服务提供商是怎样炼成的?
华仕康集团赴优食考察交流,共谱健康领域新篇章!
关爱“小树苗”在行动:丁香园·丁香医生为宁夏1500名困境儿童捐赠健康礼包
酷冷至尊推出暴雪T824散热器——超导复合热管技术,双塔散热效能再进阶
数梦工场亮相数博会 分享构建一体化数据资源体系实践经验
报名通道开启!2023中国制造之美评选正式启动
二手手机,新起点,新机会——忠机者二手手机交易电商平台
喜鹊颂强势入驻湖南浏阳省级科技园区,占领预制菜领域新高地
荣造携手易开得向驻地部队捐赠物资,奏响军民团结新篇章
一起挖呀挖 阿尔法蛋编程机甲D4炫酷开挖!
项目招商软文建立良好形象 高端的软文促使营销理念品牌推广理念
八位堂参加第五届科技无障碍发展大会,关注特殊群体助力游戏无障碍发展
为创作者释放灵感所想,ThinkBook 16p 2023起售价8499元
革新云计算,重构算力底座——杰创智能常青云产品发布会成功举办
HR SaaS+AIGC:i人事智能助手如何赋能HR业务?
TCL对消费者有多重视?看看真实反馈就知道了
Zilliz 受邀参加 GOTC ,星爵谈向量数据库之于大模型时代的重要性