本文分类:news发布日期:2026/5/11 6:28:46
相关文章
缓存增强生成(CAG)实战:预加载KV-Cache实现毫秒级知识问答
1. 项目概述:当缓存增强生成(CAG)成为知识任务的新范式最近在折腾大语言模型应用时,检索增强生成(RAG)几乎是绕不开的技术。它确实好用,能让模型“开卷考试”,回答那些它训练数据里没…
建站知识
2026/5/9 1:40:08
MPI并行编程与GPU加速集成技术解析
1. MPI并行编程模型解析 在当今高性能计算领域,分布式内存架构已成为处理大规模科学计算问题的标准配置。这种架构通过将计算任务分解到多个节点并行执行,能够显著提升计算效率。作为这一领域的核心技术标准,消息传递接口(MPI)定义了进程间通…
建站知识
2026/5/9 1:40:08
上交大师生联手“整AI“:当学生把AI解决不了的作业变成测试题
这项由上海交通大学主导、联合SII与GAIR研究团队完成的研究,于2026年5月以预印本形式发布,论文编号为arXiv:2605.02661。有兴趣深入了解的读者可以通过该编号查询完整论文。**研究概要**每个用过AI助手做作业的学生,大概都有这样的经历&#…
建站知识
2026/5/9 1:40:08
移动端大语言模型部署优化:MobileLLM-Flash架构解析
1. 移动大语言模型部署的核心挑战在移动设备上部署大语言模型(LLM)面临两个看似矛盾的需求:一方面需要模型具备足够强的语义理解与生成能力,另一方面又受限于移动设备的计算资源、内存容量和电池续航。传统LLM如GPT-3等模型参数量…
建站知识
2026/5/9 1:40:08
(B站TinyML 教程学习笔记)C11 - Edge Impulse 中的特征选择+C12 - 机器学习全流程管道+C13 - 第一模块复习+C14 - 神经网络入门
机器学习流水线(10:54 - 15:16)(10:54)机器学习流水线整体流程机器学习完整流程:收集数据特征提取模型训练模型部署推理(Inference)(11:00)数据收集深度学习通常需要大量…
建站知识
2026/5/9 1:40:08
Hugging Face推Reachy Mini应用商店,为具身智能普及开辟新路径
Reachy Mini应用商店:开源机器人软件分发新尝试5月8日,据studioglobal报道,Hugging Face正式推出Reachy Mini应用商店,这一举措旨在将现代软件分发模式引入开源机器人领域。该商店基于Hugging Face Spaces构建,用户能通…
建站知识
2026/5/9 1:40:08
商汤推新一代轻量化模型,Token 消耗降 60%,多场景实战表现亮眼!
商汤推出新一代轻量化多模态智能体模型,Token 消耗降 60%,多场景实战表现亮眼!今天,商汤正式推出新一代轻量化多模态智能体模型——商汤日日新 SenseNova 6.7 Flash - Lite,同时 SenseNova Token Plan 限时免费开放&am…
建站知识
2026/5/9 1:38:47
动态电压降分析:技术演进与工程实践
1. 动态电压降分析的技术演进与挑战在130nm工艺节点之前,芯片设计工程师主要依靠静态电压降分析方法来验证电源网络的完整性。这种方法通过计算平均有效电流来估算IR压降,虽然能够发现电源网格中的结构性缺陷(如金属层间通孔不足或电源走线过…
建站知识
2026/5/9 1:38:33

