本文分类:news发布日期:2026/5/9 16:44:13
打赏

相关文章

NPU 多流优化案例手册

NPU 多流优化案例手册 【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。 项目地址: https://gitcode.com/cann/cannbot-skills 本文收录仓库内与 NPU 多流优化相关的案例&…

Llama模型转ONNX:从PyTorch到跨平台部署的完整指南

1. 项目概述:从Llama到ONNX的模型“翻译官”最近在折腾大语言模型本地部署和推理优化的朋友,估计没少为模型格式转换头疼。特别是那些动辄几十GB的Llama家族模型,原生的PyTorch格式虽然灵活,但在生产环境部署、跨平台推理或者追求…

基于LLaMA 3与QLoRA构建台湾本地化大语言模型实战指南

1. 项目概述:一个面向特定语言与文化场景的开源大语言模型最近在开源社区里,一个名为“MiuLab/Taiwan-LLM”的项目引起了我的注意。作为一名长期关注大语言模型(LLM)技术发展和落地应用的从业者,我习惯于从项目名称和代…

CANN/atvoss内核调度运行接口

BaseKernelSchedule::Run 【免费下载链接】atvoss ATVOSS(Ascend C Templates for Vector Operator Subroutines)是一套基于Ascend C开发的Vector算子库,致力于为昇腾硬件上的Vector类融合算子提供极简、高效、高性能、高拓展的编程方式。 …

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部