本文分类:news发布日期:2026/5/9 16:43:36
打赏

相关文章

Llama模型转ONNX:从PyTorch到跨平台部署的完整指南

1. 项目概述:从Llama到ONNX的模型“翻译官”最近在折腾大语言模型本地部署和推理优化的朋友,估计没少为模型格式转换头疼。特别是那些动辄几十GB的Llama家族模型,原生的PyTorch格式虽然灵活,但在生产环境部署、跨平台推理或者追求…

基于LLaMA 3与QLoRA构建台湾本地化大语言模型实战指南

1. 项目概述:一个面向特定语言与文化场景的开源大语言模型最近在开源社区里,一个名为“MiuLab/Taiwan-LLM”的项目引起了我的注意。作为一名长期关注大语言模型(LLM)技术发展和落地应用的从业者,我习惯于从项目名称和代…

CANN/atvoss内核调度运行接口

BaseKernelSchedule::Run 【免费下载链接】atvoss ATVOSS(Ascend C Templates for Vector Operator Subroutines)是一套基于Ascend C开发的Vector算子库,致力于为昇腾硬件上的Vector类融合算子提供极简、高效、高性能、高拓展的编程方式。 …

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部