vLLM原生支持昇腾,加速大模型推理创新,社区尝鲜版本首发!

2025-02-21 13:11:27     来源:

2025年2月20日,经过vLLM社区与昇腾的持续合作和共同努力,vLLM开源社区已官方支持昇腾,并创建vLLM Ascend这一社区维护的官方项目。这意味着用户可直接在昇腾上无缝运行vLLM,开发者可通过vLLM调用昇腾进行模型适配。

图片 1.png

图注:vLLM社区创建了vllm-project/vllm-ascend项目提供昇腾的官方支持

vLLM Ascend使能vLLM在昇腾平台进行大模型推理,包含以下多个特征:

支持多种模型类型,满足多样化需求

vLLM Ascend原生支持 稠密LLM稀疏Mixture-of-Expert(MoE)、多模态等在内的主流开源大模型类型,如Qwen系列、Llama系列、DeepSeek系列等。这意味着开发者可以在昇腾平台无缝运行各类大语言模型,并且可基于vLLM进行增量特性开发,满足不同的应用场景和性能需求。

与社区共同打造大模型极致推理性能,充分释放昇腾算力

vLLM Ascend即将在昇腾平台支持vLLM多个高阶特性,如请求调度算法chunked prefill,大模型分布式并行策略 Tensor Parallelism (TP)、Pipeline Parallelism (PP)投机解码speculative decoding等,开源社区最新加速能力平滑迁移,支持昇腾平台高性能推理。

全面的社区支持,让开发更简单

用户可以通过以下途径,快速学习和使用vLLM Ascend,包括:

● 快速开始:快速开始教程详细地说明了如何开始使用vLLM Ascend。

用户指南 :提供了模型支持、特性支持等关键内容。

开发者指南 :通过贡献指南、版本发布策略等文档为开发者提供了重要参考。

社区讨论:开发者可以在社区充分交流分享,一起解决问题。

开始您的尝鲜之旅

无论是AI领域的资深开发者,还是刚入门的技术爱好者,vLLM Ascend都将为您提供一个高效、灵活的开发平台。立即开始您的尝鲜之旅,感受昇腾NPU与vLLM框架结合的魅力,共同探索大语言模型的无限可能!

现在就可以访问以下链接开始您的尝鲜之旅:

代码仓库 :https://github.com/vllm-project/vllm-ascend

文档中心 :https://vllm-ascend.readthedocs.io/en/latest/

快速开始 :https://vllm-ascend.readthedocs.io/en/latest/quick_start.html

安装指南 :https://vllm-ascend.readthedocs.io/en/latest/installation.html

版本说明:https://vllm-ascend.readthedocs.io/en/latest/user_guide/release_notes.html

欢迎加入我们,携手共建vLLM Ascend开源项目

大模型推理服务框架vLLM是LF Data & AI基金会孵化项目,因其在大型语言模型 (LLM) 推理和服务中的高吞吐量、内存高效等特点,在开源社区广受欢迎。华为是LF Data & AI基金会创始高级会员,同时也是vLLM社区的支持者和积极贡献者,华为坚持“硬件开放,软件开源,使能伙伴,发展人才”的理念,携手社区共同推进多样性算力支持改进,积极致力于vLLM优化,从而充分释放昇腾硬件的算力。

vLLM Ascend是一个使用Apache 2.0协议的开源项目,我们诚邀每一位开发者加入我们,贡献你的智慧,一起探索和贡献更多创新功能。

标签:

猜你喜欢

瑞德林全新一代钉钉AI助理“小瑞宝”亮相PCHi 2025,人工智能化身“护肤智囊”
大模型浪潮下的新机遇:从DeepSeek到新壹科技 垂直应用如何重塑AI未来
科技创新 国货之光——中宣部原副部长胡振民点赞听智慧科技
让未知,可先知,墨迹天气精准预报守护2025春运归家路
世纪华通AI自动云测平台入选“2024年度百大AI产品”
“掌上实验室”革新文物保护:艾尼提便携式显微镜助力实现现场精准修复
MOVA P60 正式发布:突破性清洁科技,引领扫拖机器人新高度
新增火花思维教育、新里程健康!朝阳区跨国公司地区总部增至169家
首个AI合同大模型 | 第三届中国电子合同峰会
Organic Garden奥己进驻奥克兰CBD核心药房,卓越品质赢本土市场信赖
极空间私有云市场表现力压群雄 斩获双平台销额销量双冠军殊荣
酷狗音乐业内率先支持Windows任务栏歌词显示,实现多任务场景下听歌自由
首都在线云平台上线满血版DeepSeek-R1!限时免费!
驾校一点通接入DeepSeek,AI 领航开启驾培行业智能新时代
技嘉 GeForce RTX™ 50 系列显示卡正式上市,散热方案全面升级释放强劲性能
调整心态迎战新学期,升学e网通硬核课助你稳步提升
施工难度爆表空调订单屡被退 京东送装一体解难题
进入倒计时!itc保伦股份舞台灯光亮相2025GETshow展,邀您共赴声光盛宴!
金柚网亮相2025上海春季招聘会,持续为求职者提供多元岗位
云原生赋能博云企业转型,openEuler加速自主创新
豪鹏科技与全球领先的AR技术企业达成战略合作,共拓AR产业新未来
2024年6月启动,Q4领先推出,鸣鸣很忙探索“省钱超市”
续航表现出色 三星Galaxy S25+收获权威媒体好评
有道2024年全年盈利超市场预期,融合DeepSeek全新品类AI答疑笔重磅推出
MiniMax紧盯底层模型加速迭代,旗下海螺AI访问量全球居首
一文总览阿里云存储产品年度升级!
华为云助力昌平率先部署全市首个DeepSeek政务大模型,基层治理数字化迈上新台阶
钉钉AI企业搜索面向所有用户免费开放
从供需到运维,墨迹天气全面赋能电力行业可持续发展
AI 变革药物研发:深势科技的云原生实践之路