本文分类:news发布日期:2026/5/17 4:42:39
打赏

相关文章

CANN/catlass Gemm/Block类模板概述

Gemm/Block 类模板概述 【免费下载链接】catlass 本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。 项目地址: https://gitcode.com/cann/catlass API 清单 blockMmad清单 组件描述block_mmad基础模板,包含BlockMm…

cann/runtime其他接口API文档

24. 其他接口 【免费下载链接】runtime 本项目提供CANN运行时组件和维测功能组件。 项目地址: https://gitcode.com/cann/runtime 本章节描述 CANN Runtime 的其他辅助接口,包括版本查询、数据类型转换等。 size_t aclDataTypeSize(aclDataType dataType)&a…

CANN/hixl LLM-DataDist数据结构

LLM-DataDist数据结构 【免费下载链接】hixl HIXL(Huawei Xfer Library)是一个灵活、高效的昇腾单边通信库,面向集群场景提供简单、可靠、高效的点对点数据传输能力。 项目地址: https://gitcode.com/cann/hixl LlmRole LLM-DataDist…

顶会论文模块复现与二次创新:二次创新:将 DETR 的查询式检测头蒸馏进 YOLOv11,打造混合式 Anchor-free 头

摘要与核心思想 在2026年的目标检测领域,YOLOv11凭借其Anchor-free检测范式与极致推理速度,依然是工业部署的主旋律;而DETR系列则凭借Transformer查询式检测头的全局建模能力,在精度榜单上持续领跑。本文将深入剖析一种已被顶会验证的二次创新路径:利用知识蒸馏技术,将D…

模型诊断:从冲突集到命中集,构建高效故障定位系统

1. 模型诊断:从原理到实践,优化系统故障定位与修复我们每天开车、网购、上网、用手机,背后都依赖着一个个复杂系统在默默运转。从汽车的发动机控制单元,到电商平台的推荐算法,再到电网的调度系统,这些系统的…

CANN/cannbot-skills 模型审查专家代理

【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。 项目地址: https://gitcode.com/cann/cannbot-skills name: model-infer-reviewer description: 模型优化审查专家&#xff…

DeepEP V2 为什么值得做 MoE 的团队现在就关注?真正先拖慢吞吐的,不是专家数,而是 EP 通信还在抢 SM

DeepEP V2 为什么值得做 MoE 的团队现在就关注?真正先拖慢吞吐的,不是专家数,而是 EP 通信还在抢 SM 很多团队一聊到 MoE,第一反应还是 router、负载均衡、FP8 或专家数怎么配。但 DeepSeek 在 2026 年 4 月底公开的 DeepEP V2,指向了一个更接近真实系统瓶颈的事实:当模…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部