本文分类:news发布日期:2026/5/17 4:14:27
相关文章
别把 SFT 里的 `packing` 当成白捡吞吐的开关:TRL 里 `bfd`、`bfd_split`、`wrapped` 真正卖掉的不是同一种东西
别把 SFT 里的 packing 当成白捡吞吐的开关:TRL 里 bfd、bfd_split、wrapped 真正卖掉的不是同一种东西
很多人做 SFT 时,一看到 packing=True 就会把它理解成“把 padding 浪费收回来,几乎没有副作用”。但我把 TRL 现在的实现、警告和一个最小模拟实验放在一起看后,结论…
建站知识
2026/5/17 4:13:37
IEDM 2013深度解析:相变存储器的可靠性挑战与产业转向
1. 相变存储器的十字路口:从IEDM 2013看技术攻坚与产业抉择十多年前,IEDM 2013上关于相变存储器的一批论文,像一面镜子,照出了这项曾被寄予厚望的技术在迈向商业化道路上的真实困境。当时,PCM正处在从实验室走向市场的…
建站知识
2026/5/9 12:41:34
CANN/AMCT大模型Cast量化
AMCT大模型量化 【免费下载链接】amct AMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。 项目地址: https://gitcode.com/cann/amct
1 量化前提
1.1 安装依赖
本sample依赖包可参考requirements.txt
需要注意的是torch_npu包版本需要与Python、torch包版本相匹配…
建站知识
2026/5/9 12:41:34
6G时代零接触式普适AI即服务架构:融合区块链与DRL的自动化AI交付
1. 项目概述:当6G遇见普适AI,一场“零接触”的服务革命如果你关注过5G,就会知道它带来的不仅是更快的网速,更是万物互联的基石。但当我们把目光投向更远的6G,会发现它的野心远不止于此。6G的核心愿景之一,是…
建站知识
2026/5/9 12:40:34
CANN/catlass Gemm/Block类模板概述
Gemm/Block 类模板概述 【免费下载链接】catlass 本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。 项目地址: https://gitcode.com/cann/catlass
API 清单
blockMmad清单
组件描述block_mmad基础模板,包含BlockMm…
建站知识
2026/5/13 1:48:48
cann/runtime其他接口API文档
24. 其他接口 【免费下载链接】runtime 本项目提供CANN运行时组件和维测功能组件。 项目地址: https://gitcode.com/cann/runtime
本章节描述 CANN Runtime 的其他辅助接口,包括版本查询、数据类型转换等。
size_t aclDataTypeSize(aclDataType dataType)&a…
建站知识
2026/5/9 12:40:34
CANN/hixl LLM-DataDist数据结构
LLM-DataDist数据结构 【免费下载链接】hixl HIXL(Huawei Xfer Library)是一个灵活、高效的昇腾单边通信库,面向集群场景提供简单、可靠、高效的点对点数据传输能力。 项目地址: https://gitcode.com/cann/hixl
LlmRole
LLM-DataDist…
建站知识
2026/5/9 12:40:34
顶会论文模块复现与二次创新:二次创新:将 DETR 的查询式检测头蒸馏进 YOLOv11,打造混合式 Anchor-free 头
摘要与核心思想
在2026年的目标检测领域,YOLOv11凭借其Anchor-free检测范式与极致推理速度,依然是工业部署的主旋律;而DETR系列则凭借Transformer查询式检测头的全局建模能力,在精度榜单上持续领跑。本文将深入剖析一种已被顶会验证的二次创新路径:利用知识蒸馏技术,将D…
建站知识
2026/5/9 12:40:07

