本文分类:news发布日期:2025/10/27 22:44:35
打赏

相关文章

分组查询注意力(GQA)的Pytorch实现

自注意力层(分组查询注意力) 初始化 class SelfAttention(nn.Module):def __init__(self, config, layer_idx):super().__init__()self.layer_idx = layer_idxself.n_head = config.n_head # 查询头的数量self.kv_he…

2025.10.20__2023秋季联赛题解(第11题)

题目大意 题意其实很清楚,就是一个模拟对战的游戏。游戏有两个角色 A、B,A 有 hpa 的血量,攻击力为 x;B 有 hpb 的血量,攻击力为 y。 A 每回合有两种操作选择:(1)攻击。对 B 造成 x 点伤害;(2)回血。消耗一…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部