本文分类:news发布日期:2025/10/28 0:57:02
打赏

相关文章

分组查询注意力(GQA)的Pytorch实现

自注意力层(分组查询注意力) 初始化 class SelfAttention(nn.Module):def __init__(self, config, layer_idx):super().__init__()self.layer_idx = layer_idxself.n_head = config.n_head # 查询头的数量self.kv_he…

2025.10.20__2023秋季联赛题解(第11题)

题目大意 题意其实很清楚,就是一个模拟对战的游戏。游戏有两个角色 A、B,A 有 hpa 的血量,攻击力为 x;B 有 hpb 的血量,攻击力为 y。 A 每回合有两种操作选择:(1)攻击。对 B 造成 x 点伤害;(2)回血。消耗一…

B树和B+树的解析应用

B树和B+树是两种重要的多路平衡搜索树结构,广泛应用于数据库和文件系统领域。下面我们将从C语言实现的角度深入解析它们的原理和实现细节。 一、B树解析 1. 结构定义 #define M 4 // B树的阶数(每个节点最多有M-1个…

最短路分治

trick其实就是快速维护网格图最短路相关的东西,可以带修之类的。Problem: 给出一个 \(n \times m\) 的网格图,格子有权值,要求支持待修改并查询两点间最短路。 \(n \le 2 \times 10^5, m \le 5, q \le 2\times 10^5…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部