本文分类:news发布日期:2026/5/14 7:24:26
打赏

相关文章

CANN MXFP4量化矩阵乘算子

MXFP4量化矩阵乘算子 【免费下载链接】cann-samples 算子领域高性能实战演进样例与体系化调优知识库 项目地址: https://gitcode.com/cann/cann-samples 概述 本示例展示了MXFP4量化矩阵乘算子在昇腾AI处理器上的完整实现,包含基于SWAT模板的高性能优化方案…

CANN DeepSeek-V3.2-Exp推理优化实践

NPU DeepSeek-V3.2-Exp推理优化实践 【免费下载链接】cann-recipes-infer 本项目针对LLM与多模态模型推理业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-infer DeepSeek团队发布了最新的模型Deep…

体验Taotoken多模型聚合端点的低延迟与高稳定性连接

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 体验Taotoken多模型聚合端点的低延迟与高稳定性连接 对于依赖大模型API进行开发的团队而言,服务的连接速度和稳定性是影…

CANN/graph-autofusion SuperKernel开发指南

Developer Guide 【免费下载链接】graph-autofusion Graph-autofusion 是一个面向昇腾(Ascend)芯片的轻量级、解耦式组件集合,旨在通过自动融合技术加速模型执行。 目前已开源 SuperKernel 组件,未来将持续开放更多自动融合相关模…

CANN/ge GE架构文档

GE 架构文档 【免费下载链接】ge GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部