深度学习论文: GKDT: General Keypoint Detection Transformer 深度学习论文: GKDT: General Keypoint Detection TransformerGKDT: General Keypoint Detection TransformerPDF: https://arxiv.org/pdf/2607.00752PyTorch代码: https://github.com/shanglianlm0525/CvPytorchPyTorch代码: https://github.com/shanglianlm0525/PyTorch-Networks1 概述人仅凭少量参考图或文字描述即可快速识别关键点,受此启发,现有提示式关键点检测模型分为视觉提示、文本提示、多模态提示三类。但这类模型大多基于小规模单领域数据集训练,跨域迁移与未知物体泛化能力不足。为此本文构建统一大规模关键点数据集MegaKPT:整合29套数据集共134万物体实例并统一标注规范。对比仅41.8万实例的UniKPT,MegaKPT数据量更大,还修正标注噪声、完善关键点文本、清晰划分大类索引,使用门槛更低。该数据集首次为正畸头颅片、手部X光等医疗影像提供标准化关键点文本,大幅简化医疗地标零样本检测。为适配海量多样数据,本文提出基于DINOv3的通