加速替代CUDA!摩尔线程开源vLLM
[综合] 时间:2024-12-28 03:38:15 来源:板板六十四网 作者:综合 点击:54次
11月5日消息,加速近日,替代摩尔线程上线了大语言模型高速推理框架开源项目vLLM的线程MUSA移植版本,为开发者提供基于摩尔线程全功能GPU进行开源项目MUSA移植的开源范例。
摩尔线程表示,加速正努力围绕自主研发的替代统一系统架构GPU、MUSA软件平台,线程构建完善好用的开源MUSA应用生态。
vLLM是加速一个高效且易用的大模型推理和服务框架,支持创新的替代PagedAttention内存管理、连续批处理请求、线程CUDA/HIP图的开源快速模型执行、CUDA核心优化、加速分布式推理支持等,替代可显著提高大语言模型(LLM)的线程推理性能。
目前,vLLM已在各种大语言模型中得到广泛应用,成为业界常用的开源大模型推理框架。
摩尔线程基于vLLM v0.4.2版本,进行了移植适配,使之支持摩尔线程GPU后端Device,并完全开源,开发者可以二次开发、升级vLLM到社区更新版本等。
值得一提的是,得益于摩尔线程MUSA架构的先进性、软件栈对CUDA的优良兼容性,通过MUSIFY代码自动转换工具,用户可以快捷地将原有的CUDA代码迁移到MUSA平台,实现替代。
同时,CUDA相关库的调用,也可以快速替换为相应的MUSA加速库,如算子库muDNN、集合通信库MCCL、线性代数库muBLAS等。
摩尔线程通过MUSA软件栈对CUDA软件栈接口兼容,大幅提升了应用移植的效率,缩短了开发周期,还提供MUSIFY自动代码移植工具等一系列实用工具和脚本。
摩尔线程vLLM-MUSA开源地址:
https://github.com/MooreThreads/vLLM_musa
(责任编辑:休闲)
相关内容
- TheShyBin对位单杀记录,bin哥又骗我们,你根本不是陀螺
- 台湾橄榄球教练在闽化身志愿者 助力心智障碍青年体育运动交流
- 谁是你传球最好队友?贝弗利:哈登独一档😎乔治绝对最垃圾😅
- 美国芯片不再安全 谨慎采购!业内人士:国内汽车企业早有准备
- [流言板]Shams:湖人愿意交易三个首轮来得到一个或多个球员
- 第二届海峡两岸交流融合月在深圳开幕
- 图片报:法兰克福对万纳感兴趣,若获欧冠资格他可能被拜仁外租
- 《文明7》新的时代系统将帮助玩家完成游戏
- 出战373场打进229球,萨拉赫升至利物浦队史射手榜第4位
- 电视太卡先别扔:教你三招 让老电视焕发青春
- 老外围观华为Mate 70首销现场:说强得飞起 竖起大拇指
- 第二届海峡两岸交流融合月在深圳开幕
- [流言板]杰威谈SGA关键三分:关键球员会打出关键的表现
- 华为Mate 70拆解:麒麟9010芯片再次现身