一秒记住【笔趣阁小说网】
biquge678.com,更新快,无弹窗!
与此同时,圣克拉拉,英伟达总部。
黄仁勋正穿着他那件标志性的皮衣,在会议室里来回踱步。
他的面前,同样摆着那篇论文。
「你们怎麽看?」老黄停下脚步,目光如电,扫视着在座的技术高管。
「Jensen(黄仁勋英文名),这个算法对我们的CUDA生态是个挑战。」一位首席架构师面色凝重,「它大量使用了min丶max这种非线性算子,而且数据依赖性很强,无法像矩阵乘法那样进行大规模并行流水线优化。在H100上跑这个,SM单元的利用率可能连20%都不到。」
【写到这里我希望读者记一下我们域名找台湾好书上台湾小说网,t??w??k??a??n??.c??o??m??超方便】
「也就是说,我们的显卡,在这个算法面前,变成了『废铁』?」老黄的声音很冷。
「不能说是废铁,但确实……性价比极低。」
老黄沉默了。
作为「AI军火商」,他最怕的不是竞争对手,而是「技术路线的变更」。
英伟达之所以能躺着赚钱,是因为全世界都在用Transformer,都在做矩阵乘法。他只要把矩阵乘法做到极致,就能垄断市场。
但现在,有人想换个玩法。
这才是英伟达最担心的事情。
英伟达的护城河,从来不仅仅是硬体性能,而是CUDA生态。数百万开发者习惯了调用cuBLAS丶cuDNN这些高度优化的库来构建模型。如果一种新算法绕过了这些库,甚至需要全新的硬体支持,那麽英伟达的垄断地位就会出现裂痕。
「AMD那边有什麽动静?」老黄问道。
「MI300系列的架构比较灵活,他们在标量计算单元上保留了更多的资源,理论上跑SLRM会比我们稍微从容一些。」技术部主管回答,「而且,他们最近在积极接触PyTorch团队,试图推动对非矩阵算子的原生支持。」
「不能给他们机会。」老黄的眼神变得冷峻。
他走回座位,双手撑在桌面上,下达了一系列指令。
「第一,软体层面。立即启动cuSLRM项目。抽调最精锐的CUDA工程师,针对SLRM的核心算子进行手写汇编级优化。我要让全世界看到,即使是跑几何逻辑,英伟达的GPU依然是最快的。」
「第二,硬体层面。Blackwell架构的设计已经冻结,来不及大改。但在下一代Rubin架构中,必须预留专门的『逻辑推理单元』。我们要把这种非线性计算,也变成硬体原生的指令。」
「第三,生态层面。」老黄顿了顿,语气中透出一丝商业巨头的狠辣,「联系PyTorch和TensorFlow的维护团队,以『技术合作』的名义,提供专项资金和人力,帮助他们优化基于CUDA的SLRM实现。我们要确保,当开发者想要尝试这个新算法时,他们最先想到的丶最好用的工具,依然是跑在英伟达显卡上的。」
「我们要用生态的厚度,去淹