你手持手机, 轻触屏幕点开一款 AI 绘画软件, 在键盘灵动敲击输入“赛博朋克风格的上海外滩, 下着金色的雨”, 短短五秒钟, 一张高清图跃于眼前。你不禁惊叹出声“这玩意儿真牛逼”, 随后手指一划, 继续浏览下一条内容。
可对于你并不明白的状况, 在于要促使你这份五秒钟的愉悦, 其背后却是有着上千块芯片一同燃烧了十五分钟的电量。
这就是2026年的AI算力。
一个我们每天都在用,但几乎没人真正理解的东西。
算力到底是什么?能吃吗?
简单说,算力就是计算机干活的能力。
不过, AI算力却并非如此。传统计算机进行运算时呈现线性特征——当你要求它计算1+1, 它便会去计算1+1。而AI算力是凭借“猜测”得出结果的——在你给予它一千万张猫的照片后, 它自行掌握了“原来这种毛茸茸的事物称作猫”, 随后当它看到一张全新的照片时, 它能够识别出“这是猫”。
这一过程需诸多数学运算, 究竟多少? 训练一回如GPT - 4这般的大模型, 所需运算量约为2.15乘10的25次方次浮点运算, 此数字究竟多大? 倘若让一人以手算, 从宇宙大爆炸算起直至如今, 大概尚未算至万分之一。
所以人类发明了专门的芯片来做这件事。
全球芯片到底有多少?
二零二五年年末的时候的数据表明, 全球专门用来作AI训练的GPU芯片存量大概是六百二十万块, 其中的A100和H100系列占了差不多七成。
但这远远不够。
据于2026年3月发布的报告显示, 全球AI算力的需求每隔九个月便会翻上一番, 此速度较摩尔定律更快, 摩尔定律所指乃是芯片性能每十八个月实现一番的增长, 如今可好, 需求端的增长速度相较于供给端足足快了一倍。
我们正在经历一场算力的“饥饿游戏”。
为什么算力不够用?
原因其实挺扎心的。
第一个原因在于模型正变得愈发庞大, 在2023年之际, 主流大模型的参数规模尚处于千亿级别, 而到了2026年, 万亿参数级别的模型已然不再是稀罕之物, 甚至有研究团队弄出了十万亿参数的试验品。
参数一旦较多, 所需得算力便会呈指数级地上升, 此并非是线性的那种关系, 而完全属于暴力式的增长。
其第二个缘由乃在于用户数量过于庞大, 步入2026年第一季度时, 全球范围内活跃的AI应用用户数量已然突破了38亿, 这也就意味着, 近乎一半的地球居民, 每月最少会使用一次AI工具, 而每一个人用上一次, 其背后皆伴随着算力的消耗。
还有第三个缘由, 这也是极易被忽视的一点, 那便是浪费, 多数AI应用的算力利用效率实则相当低, 我曾碰见一些公司, 明明只需一个小型模型便能够解决的问题, 却非要动用大型模型, 就如同动用航空母舰去捞一条金鱼那般, 既耗费燃油又占据空间。
算力贵吗?贵到离谱
2026年, 一块高端AI芯片, 在黑市的价格, 已然被炒到了45万元人民币以上, 留意, 这可是黑市价哦 , 于官方渠道, 你根本就买不到, 得排队 , 得需要配额。
在主流云服务平台那儿, 租用算力并非低廉, 租用一个有着8块H200芯片的服务器节点, 每小时所需费用大概是680元, 而训练一个中等规模的模型, 通常得运行两周到一个月, 仅算力成本就处于一百万左右呀。
小公司根本玩不起。
这便造就了一种可怖的马太效应, 即有钱的公司愈发壮大, 没钱的公司在门口打转。于全球AI算力资源里, 前五大科技公司占据了超六成份额。剩余几万家公司, 仅能获取些许残羹剩饭。
有没有替代方案?
有,但都不完美。
有一种方案选择的是运用专用芯片, 此芯片即ASIC, 它是专门针对AI运算而设计的, 其效率相较于通用GPU要高出许多, 谷歌的TPU就是一个典型的实例, 最新的TPU v6版本在特定任务方面的能效比是H200的3.2倍, 然而问题在于, 这个东西仅仅当处于自身的生态体系中才好用, 倘若换作别的平台那就不行了。
第二种方案为量子计算, 其听着相当酷炫, 然而在2026年时量子计算机仍处于实验室阶段, 当前最为先进的量子计算机, 仅仅是勉强处理了几个数学问题, 距离运行AI模型而言那可是差得非常非常远。
关于“边缘计算”, 这是第三种可以实施的方案, 它的做法是, 不让所有的计算全部集中在云端上, 而是让手机进行一部分计算, 让电脑也进行一部分计算, 再让智能音箱同样进行一部分计算。苹果公司会在2025年底的时候推出A18 Pro芯片, 这款芯片集成有专门用来使AI运行的神经引擎, 其算力大概是50 TOPS。这样的算力足够用吗? 用来运行简单的语音, 识别是可以的, 然而若是运行复杂一些的内容, 就会出现问题了。
未来的走势会怎样?
我觉得有几个趋势是确定的。
芯片数量不会增多, 然而会更具高效性, 芯片制造工艺已然渐渐逼近物理极限情形, 先是3纳米之后为2纳米, 接着2纳米之后是1.5纳米的状况, 但是再往下就要直面量子隧穿效应存在的问题影响了。电子会自行产生“逃离”出去这样的情况, 致使芯片无法正常开展工作运行。所以未来的得以突破并非依靠堆砌材料方式, 而是依靠设计这一手段方式。
将成为如电那般公共资源的是算力, 你现下不会去思索 “这个插座背后究竟是火电站还是水电站”, 未来你同样毋需去操心 “这个AI所运用的是何人之芯片”, 会被抽象化、网格化, 进而变成为随取随用之基础设施的是算力。
全行业将会历经一回大规模的清理整顿。因为算力的价格过高, 所以那些依靠投入大量资金来维持运营得以存续下去的人工智能公司将会有一部分走向消亡。而最终留存下来的公司, 要么是在技术方面确实具备非常强的实力, 要么是能够寻觅到具体的实际应用场景, 并且能够实现盈利赚钱的。
最后说点人话
撰写这篇内容之际, 我处于使用一台平常笔记本的状态。该笔记本内部不存在任何一块专门用于AI的芯片。然而, 我所运用的输入法, 我曾经开启过的搜索引擎, 以及我相册里的人脸识别功能, 其后台均在耗费算力。
算力这东西,看不见摸不着,但你已经离不开它了。
就像你感受不到地球在自转,但你知道太阳明天还会升起来。
有友人询问我, 算力是否会如同比特币那般出现崩盘的情况, 我回应称不会。比特币是虚幻的, 算力是实在的。你能够不关注比特币, 然而你绝对不可能不使用手机。在未来, 你或许还得借助AI来帮你撰写邮件、帮你处理修图、帮你制作PPT。
算力是新时代的石油这句话,已经被说烂了。
但说烂了,不代表不对。
然而, 石油一旦彻底烧尽便不复存在了。而算力消耗殆尽之后, 留存下来的却是一系列更为聪慧的模型, 还有更为好用的工具, 以及更为便利的生活。
这么一想,花那么多钱,好像也值了?