本文分类:news发布日期:2026/5/17 4:14:27
打赏

相关文章

别把 SFT 里的 `packing` 当成白捡吞吐的开关:TRL 里 `bfd`、`bfd_split`、`wrapped` 真正卖掉的不是同一种东西

别把 SFT 里的 packing 当成白捡吞吐的开关:TRL 里 bfd、bfd_split、wrapped 真正卖掉的不是同一种东西 很多人做 SFT 时,一看到 packing=True 就会把它理解成“把 padding 浪费收回来,几乎没有副作用”。但我把 TRL 现在的实现、警告和一个最小模拟实验放在一起看后,结论…

IEDM 2013深度解析:相变存储器的可靠性挑战与产业转向

1. 相变存储器的十字路口:从IEDM 2013看技术攻坚与产业抉择十多年前,IEDM 2013上关于相变存储器的一批论文,像一面镜子,照出了这项曾被寄予厚望的技术在迈向商业化道路上的真实困境。当时,PCM正处在从实验室走向市场的…

CANN/AMCT大模型Cast量化

AMCT大模型量化 【免费下载链接】amct AMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。 项目地址: https://gitcode.com/cann/amct 1 量化前提 1.1 安装依赖 本sample依赖包可参考requirements.txt 需要注意的是torch_npu包版本需要与Python、torch包版本相匹配…

CANN/catlass Gemm/Block类模板概述

Gemm/Block 类模板概述 【免费下载链接】catlass 本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。 项目地址: https://gitcode.com/cann/catlass API 清单 blockMmad清单 组件描述block_mmad基础模板,包含BlockMm…

cann/runtime其他接口API文档

24. 其他接口 【免费下载链接】runtime 本项目提供CANN运行时组件和维测功能组件。 项目地址: https://gitcode.com/cann/runtime 本章节描述 CANN Runtime 的其他辅助接口,包括版本查询、数据类型转换等。 size_t aclDataTypeSize(aclDataType dataType)&a…

CANN/hixl LLM-DataDist数据结构

LLM-DataDist数据结构 【免费下载链接】hixl HIXL(Huawei Xfer Library)是一个灵活、高效的昇腾单边通信库,面向集群场景提供简单、可靠、高效的点对点数据传输能力。 项目地址: https://gitcode.com/cann/hixl LlmRole LLM-DataDist…

顶会论文模块复现与二次创新:二次创新:将 DETR 的查询式检测头蒸馏进 YOLOv11,打造混合式 Anchor-free 头

摘要与核心思想 在2026年的目标检测领域,YOLOv11凭借其Anchor-free检测范式与极致推理速度,依然是工业部署的主旋律;而DETR系列则凭借Transformer查询式检测头的全局建模能力,在精度榜单上持续领跑。本文将深入剖析一种已被顶会验证的二次创新路径:利用知识蒸馏技术,将D…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部