真能替换NVIDIA? 我看这玩意够呛

日期:2025-02-17 08:34 浏览:

都说资源市场素来不缺故事讲,近来 A 股年夜神们讲的故事那都绕不开 Deepseek ,种种小作文全方面吹了一波国产年夜模子的技巧道路,想必列位也曾经快听吐了。眼瞅着 Deepseek 的底裤都快被人扒上去了,我心想着这下总归不会有新货色能够拿出来了罢,各家上市公司的股价也能够消停一波了。成果这两天又在微博刷到多少篇震动体作文,说 “ Deepseek 曾经是前菜啦, LPU 才是真正的氢弹级冲破! ” 一听氢弹都来了,仍是点出来看看吧。我也猎奇,这号称能抹杀 NVIDIA 前途的 LPU 芯片究竟是什么来头。不外在持续看了多少篇文章、读了多少篇研报之后,我感到这芯片真没股票专家们吹得那么美妙。起首给各人先容一下 “ LPU ” 究竟是个啥。它并不是什么新货色,特指客岁美国 Groq 公司宣布的一款 AI 处置器,的中文名字叫做 “ 言语处置单位 ” ,给年夜言语模子做推理盘算用的。值得一提的是现在临时不任何国产的新闻,说瞎话这观点就算用在炒 A 股上也是有点超前了。它现在又被各人拿出来炒,仍是由于有人研讨了 Deepseek 的低本钱计划,发明他们仅仅在 CUDA 驱动的 PTX 层做了一些优化,就实现了内存跟通讯效力的年夜幅晋升。那么假如再 “ 为算法独自计划硬件 ” ,效力的晋升会愈加可不雅。于是年夜伙儿忽然想开了,之前干 AI 就往上堆显卡的做法是本人把路走窄了。现有的硬件跟软件都能再压迫压迫,能起到事半功倍的后果。这软件 Deepseek 干了,硬件嘛,研讨员们翻箱倒柜找出来的玩意就是 LPU 了。作为针对年夜言语模子推理专门计划出的硬件,在宣布之初,官方声称它的推理速率是 NVIDIA GPU 的十倍,本钱却仅有 NVIDIA 的非常之一。它的高效力实现道理实在不庞杂, LPU 把通用 GPU 外头的高带宽内存( HBM )换成了容量更低、但速率更快的静态随机内存( SRAM ),对年夜言语模子这种须要频仍读取内存的盘算来说,推理速率就会快不少。给各人举个例子吧, HBM 就比如是底本的双向八车道,固然很宽但什么车都能跑、红绿灯也多,反而很轻易堵在一同;而 SRAM 就像是双向两车道、只能跑公交的疾速路,固然车道变少了,但通行效力却更高。听起来有点意思是吧?家喻户晓,这显卡是底本是给游戏佬们打游戏用的,误打误撞整了个 CUDA 之后被人发明很合适算 AI ,老黄也因势利导规划了一下通用 GPU 跟 AI 运算,成果就培养了现在的万亿帝国;这 LPU 听名字就是给年夜模子筹备的,这岂不是比 NVIDIA 的出发点还要高?好了,说到这里我要开端泼冷水了:现实受骗前 LPU 的范围性可能比你设想的要多,将来怎样样欠好说,至少当初看来想替换通用 GPU 还差点意思。为懂得释这个成绩,咱们起首得讲一个看起来名义没什么关系的故事——存眷币圈的老哥们可能都晓得,有个货色叫做 ASIC 矿机。这里所谓的 “ ASIC ” 是一种专为某种用处定制的芯片。用于挖矿的 ASIC 直接在硬件层面就实现了某种挖矿算法,如许一来挖矿的效力要比显卡高上不少,用度也要廉价一些。你看,更低本钱、更高效力、公用芯片,听起来跟 LPU 似乎是一个门路呀?然而直到最后,显卡都不被 “ 矿场 ” 镌汰,仍是老黄本人脱手自废武功,禁了 40 、 50 系显卡挖矿时的 HASH 算力。这是为什么呢?由于 ASIC 矿机的盘算效力确切是高,但价值就是 --- “ 公用 ” 。后面说到了, ASIC 芯片在硬件计划层面就婚配了挖矿的算法,以是就招致挖比特币的 ASIC 矿性能且只能挖比特币、挖以太坊的能且只能挖以太坊。矿主们如果想换个币挖挖,那得连呆板一块换了才行。这就有点形象了哇:如果哪天比特币不值钱了,哥们囤的比特币矿机不就都成了矿渣了?厥后加密货泉逐步井喷,一天发一个新币种不难,然而一天计划一款新的 ASIC 挖矿芯片可就没那么轻易了。当初年夜伙应当清楚了,显卡比拟矿机看似毫无上风却能耐久不衰,重要起因就在于显卡更 “ 通用 ” 。即便 NVIDIA 40 系开端曾经不再能挖矿了,矿场上仍是有良多 30 系的显卡在发光发烧。而 LPU 这边儿也是差未几情理,正由于它是公用于年夜言语模子推理的芯片,以是如果让它处置个图片视频之类的就不上风了。可现在人们都想让 AI 干更多的事儿,除了能推理还须要它能辨认物品、听懂言语,端赖 LPU 撑起 AI 算力的一片天显然不事实。并且在 AI 练习这方面,内存较小的 SRAM 也为难年夜用,仍是得显卡脱手。并且, “ASIC 矿机 ” 可能引爆市场另有一个起因——它不只仅是比显卡高效那么简略,它是比显卡的效力高了一千多倍!比特币 ASIC 矿机开展到最后,挖矿效力乃至比显卡高了上万倍!但现在的 LPU 芯片远不这么夸大的效力晋升:Groq 官方说效力晋升一百多倍,也有消息说晋升十多少倍。但不管是哪个信源的论断,都比昔时 ASIC 矿机的成就差远了,谁能保障 LPU 会不会成为更不值钱的矿渣?另有各家资源娓娓而谈的本钱,实在客岁的这个时间,咱们的偕行《 芯货色 》也写过 LPU 芯片的报道,此中援用了前阿里副总裁贾扬清做过的一个大略的测算。依照三年时光的经营本钱来盘算, Groq LPU 的洽购本钱会是 NVIDIA H100 的 38 倍,经营本钱则到达了 10 倍。看到这里, LPU 芯片现在是个什么程度信任各人也都比拟明白了。我并不以为 LPU 是个没用的货色,究竟昔时 NPU 刚推出的时间,小搭档们广泛也都不太看好——然而现在多少乎只有是个花费级的处置器芯片,外面就汇集成一个小型 NPU 。但我感到,现在吹 LPU 仍是有点儿为时过早,尤其是各路 A 股年夜神借着 LPU 就开端 “ 荐股 ” ,搞得我也挺疑惑儿的,不知情的还认为 LPU 是中国公司造的。这可真是有点儿不刻薄了。更况且,当下的 AI 行业仍是有良多的不断定性—— Deepseek 的低本钱形式会不会是过眼云烟?当初的 AI 模子会不会被更高效的代替?下一代 GPU 会不会有划时期的技巧冲破?这些谁也说禁绝。固然了,将来的不断定性也有可能是对 LPU 有利的。但现阶段咱仍是别听 A 股年夜神们胡吹,他们如果能压准,早就不在这儿给你推举 LPU 观点股了。

0
首页
电话
短信
联系