编程日记

列表

【大模型部署】零成本体验私有化部署llama3.1

这篇文章主要介绍在自己本地gpu性能不足或者没有gpu的时候,如何部署体验llama3.1。 解决方案: 采用腾讯cloud Studio免费算力,结合ollama工具私有化部署llama3.1-8b 模型 注册腾讯Cloud studio,注册网址https://cloud.tencent.co…

ico多个尺寸用PNG,BMP哪个更小

普通JPG图片,如果本身不透明,改成透明位图方式加入ICO是否会变大?如果是加载透明PNG,改成非透明模式,以PNG或BMP方式存入,体积是否会变小?这是一个非常硬核的优化问题。要回答这个问题&#xff…

RAG可以不用向量库?来围观一下这是怎么回事呢

前言近年来,RAG(Retrieval-Augmented Generation)几乎成了大模型落地的标配方案。开发者们投入大量精力优化embedding质量、调整chunk大小、尝试各种向量数据库组合,试图让检索结果更“贴切”。但一个根本性问题始终悬而未决&…