顶部横幅广告
  • 微信
您当前的位置:首页 > 资讯

暴涨 1.3 万亿!老黄笑哈哈,谷歌要偷家 氢能源发展再加速房山将成产业“热土”东实股份深市主板IPO获受理 五成左右营收依赖东风集团北京独角兽企业数量领先 产学研融合助力城市创新发展中证指数有限公司

作者:三青 时间:2023-06-04 阅读数:人阅读

 

"大家都在抢我的芯片!"

昨夜,全球算力总龙头英伟达发布一季度财报。

总营收 72 亿美元,超过市场预期的 65 亿。万众瞩目的 AI 芯片业务,营收创历史新高,同比上涨 10%;大家不太看好的游戏业务,收入也高出预期。

盈利方面,同样爆炸,毛利率、EPS 都超过了先前的指引和市场预期。

最重要的二季度营收指引,不但没有继续下降,反而大增 33%,比原来分析师的预期高出 53%。

业绩这么好,股价盘后直接暴涨 25 个点,比一个 AMD(1750 亿美元)还多,并有望成为全美第七家市值 1 万亿美元的公司。

世界奇观啊,前段时间梭哈的,怕是睡着了都要笑醒。

英伟达走势,来源:Choice

但问题也接踵而至。

英伟达的顶峰,到底在哪里?

现在上车,会不会太晚?

01

臭打游戏的,改变世界

《华尔街之狼》里有个很酷的观点:制造需求。

当消费者意识不到自己需要什么的时候,你去提醒他,就能多出一片市场。

形象点的概括,就是 "真香"。

最典型的案例,是工业革命早期的棉布热潮

资本家买纺纱机的目的,原本只是提高生产力,用更少的工人产更多的布。

没想到,机器性能太猛,直接把产能拉爆,消费者都不够用了。

为了把库存卖出去,纺织厂只能去创造新需求,把棉布降价卖给穷人。

当穷人们穿上棉衣:"这丝滑的感觉。以前的麻布衣服,真的是抹布!"

棉布的需求于是爆炸性增长,供给又变得不足。

为了跟上市场需求,农民扩大棉花种植,纺织作坊进化成纺织工厂,技术人员改进技术,最后搞出了蒸汽机。

第二次工业革命时期,也有类似的剧本。

资本家借助国家的武力,建立起世界市场,将产品卖到亚非拉。当这些地方的老百姓用上火车、电灯、火柴,惊呼原来还有这么方便的东西。

巨大的需求缺口立刻滚滚而来。为了扩大产能,又一次技术大改革开始。

不过,世界市场实在太大,为了更高效收割,老牌工业国干脆把产业链转移到后发国家,又把现代金融体系建立起来了。

这种创造需求、满足更多需求的轮回,是近代世界历史的一条暗线。

今时今日,这个剧本仍在不断重演。不论是宏观经济,还是在每一个细分领域。

来源:《人教版必修二》

IBM 董事长沃森,曾有一句名言:全世界只需要五台计算机的算力。

显然,他没想到,宝贵的算力和芯片,会被市场和消费者拿来玩儿。

最初,半导体的主要需求方是军事和科研单位。但是,又不打仗了,这些需求很快就达到极限。

怎么办?还是老一套:创造需求

1974 年,雅达利推出 pong 家用机,销量达到 15 万,而同时期 PC 市场规模只有几千台。

1975 年,MOS 科技推出 6502 游戏芯片,后来乔布斯发家的 Apple II,搭载的就是它。

1978 年,北美家用游戏机 + 街机市场共盈利 12 亿美元,而 PC 市场规模才 5 亿美元。

游戏机这么强,正是因为贪玩的大众创造了巨大需求,从而形成一个稳定的市场,让做硬件有利可图,给了科研人员一条活路。

这不仅保护半导体活过了 70 年代,还带来了足够多的 money,让技术能够以摩尔定律的速度爆发式成长。

正好对应了创造需求的下一步:满足更多需求。

1992 年,《德军总部》拉开 3D 时代序幕,引爆了全球游戏市场。眼看巨大的商机,游戏厂商便找硬件厂商寻求技术支持。

也就是,显卡。

第一个给出解决方案的是 3dfx 公司, Voodoo 加速卡登上历史舞台,很快成为爆款。

各方纷纷效仿,美国市场瞬间出现了上百家做显卡的公司,竞争及其激烈。

直到 1999 年,英伟达推出第一款现代意义上的 GPU —— GeForce256,性能吊打市面上所有显卡。它的牛逼之处在于,从硬件上接管了 CPU 转换和光照计算,彻底解放 CPU。

这就是需求的力量。

尤其在 2007 年后,智能手机登上舞台,再一次拓宽了游戏的边界。

所有手机在讲自己性能好的时候,无一例外,都是用游戏举例子。

这种需求催生出一代又一代高性能芯片。

游戏推动了第一张骨牌,无数产业的故事,就此开始。

平均每部手机中射频芯片价值(美元),来源:天风证券

比如,3D 技术的跨越式发展,从根本上改变了电影的生产模式。

从前,特效大片需要先画故事版,然后让演员在绿幕前面,对着空气表演,再把素材交给后期,加各种酷炫特效。

但 3D 引擎将这一切反过来。把通用素材提前准备好,组合就能获得上乘场景。演员只需在场景中表演,特效与人融为一体,成本降了一大截。

《曼达洛人》有一半的特效镜头,都是用这种手法拍摄的。

这一切,都源于无聊的游戏玩家们,想要在游戏里数腿毛。

又比如,2020 年开始,游戏显卡占英伟达营收比例越来越低,数据中心的订单越来越多。

数据中心买显卡回去,当然不是用来玩游戏,而是用这些显卡过剩的算力搞大数据计算,全世界有相当多的人工智能公司,要依靠显卡芯片提供的算力进行深度学习。

可以说,没有游戏,显卡的发展绝不会如此迅速,AI 的大爆发也极可能被延后数十年。

来源:中信证券

正是那群 " 臭 " 打游戏的,对光线和细节丧心病狂的追求,催促着算力向更高层次进发,而这些算力又用在了更多地方。

然后世界变了。

02

帝国的裂痕

2018 年,《财富》杂志举办活动,有人问黄仁勋:你何时知道英伟达公司将会改变世界的?

答:1993 年 2 月 17 日,我成立公司的日子。不改变世界,我创个什么业?

这肯定有吹牛的成分。

显卡吧有诗曰:"先有老黄后有天,显卡在手日神仙。"

在游戏世界中,黄仁勋是玩家口中的 " 两弹元勋 "、爆破鬼才;在加密货币世界里,他是显卡疯子;在 AI 爆发的时代,他同样站在顶端,俯看竞争者为自己的显卡疯狂。

黄仁勋的成功,当然并非偶然。

世纪初,英伟达踩着所有对手的尸体,稳稳坐到显卡领域的王座上。

但这个位子,不是那么好坐的。

在 PC 时代早期,不论是对玩家还是游戏厂商而言,显卡都是一种极易过时的消费品。

除了游戏不断推陈出新,电脑本身也每隔几年就更新迭代,对显卡的性能要求,越来越高。

一方面,这形成了持续的消费力;但另一方面,如果跟不上新产品的步伐,等待 GPU 厂商的,只有收入暴跌、淘汰出局的结果。

这就像火烧屁股一样,催促着英伟达不断朝着更强大的技术前进,直到成为今天的模样。

但 GPU 在 AI 领域出圈,确实是偶然。

打从一开始,GPU 就不是为训练神经网络所生,而是图像。

更具体点说,是为了将 CPU 从图像显示的苦力活中解放出来而生。

GPU 和 CPU,虽然结构差异显著,但本质上都遵循冯 · 诺依曼结构,存储和运算是分离的,存在明显的效率瓶颈。

在分支众多的 AI 神经网络中,这是很要命的。

神经网络每增加一个分支,GPU 就要增加一次内存访问。在 AI 模型越来越庞大的当下,GPU 消耗在内存访问上的能耗,要远比运算高很多倍。

简单说,就是效率不行。

人工智能技术发展得越快,这些问题就暴露得越多。

对此,黄仁勋祭出两套方案,齐头并进:

1.暴力堆算力。AI 对算力的需求每 100 天就翻倍,这是悬在所有人头上的利剑。他们只能一边痛骂老黄心黑,一边像舔狗一样抢光所有芯片。

2.做生态系统,逐步解决 GPU 与 AI 场景不匹配的问题,包括功耗、内存、带宽瓶颈等等。

前者保证有肉吃,后者保证永远有肉吃。

这就是为什么,同样做芯片,英伟达的市值是英特尔的五倍,游戏、加密货币、云计算以及 AI 大模型,都离不开它的产品。

如果只是在硬件上内卷,不可能达到这么高。

除了 GPU 芯片设计能力,英伟达最宝贵的财富,是基于 CUDA 模型,孵化了大量的开发者和软件生态。

就像 Android 和 iOS 一样,遇到鸿蒙这样的挑战者根本不怕,因为即便后来系统做得再好,但是没有生态也是白搭。

英伟达发布 CUDA 后,先后推出居里、特斯拉、费米、开普勒、麦克斯韦、帕斯卡、伏特、图灵、安培、赫柏等一些列架构,用以支撑 Graphics 和 Computing 这两大场景。

但是,效果并不好。

正如 CPU 优秀的调度能力,以牺牲算力为代价一样,魔改后的 GPU 在算力上的堆叠也越来越克制。

在 AI 场景下,越来越难以匹敌专用芯片。所幸的是,后者并没有量产。

手握终极 " 缝合怪 "H100,黄仁勋暂时可以松一口气,目前市面上还未出现更能打的量产芯片。

但挑战者,并不是没有,还很强力。

一个典型的深度神经网络架构,来源:towards data science

最有实力的,当然还是谷歌。

4 月初,谷歌首次公布了 AI 超算的细节——TPU v4 性能相较 v3 提升 10 倍,比 A100 快 1.7 倍,同时功耗少 1.9 倍。

和 H100 对打的芯片,也已经在研发中,它并非没有胜出的机会。

相反,因为更适用于 AI 场景,只要能量产,谷歌 TPU 会更受欢迎。

比如,本轮 AI 热潮除了 OpenAI 外,还有两家出圈的公司,一家是 AI 绘图公司 Midjourney;另外一家是 Authropic,其对话机器人 Claude 跟 ChatGPT 打的有来有回。

而这两家公司,都没有购买英伟达 GPU 搭建超算,而是使用谷歌的算力服务。

当然,这两者加起来,也比不过微软自研 Athena 芯片所带来的冲击。

最近市场传出微软与 AMD 合作开发新款 AI 芯片,加快推出相关产品,为自身及市场提供英伟达 GPU 之外的另一种底层硬件选择。

"如果 Athena 具有竞争力,与 Nvidia 的产品相比,它可以将每芯片的成本降低三分之一。"

此外,针对 CUDA 模型,OpenAI 最近还推出了 " 简化版 CUDA":Triton

这是种新的语言编译器,性能媲美 CUDA,操作难度却低得多:只需 25 行代码,就能在 FP16 矩阵乘法上达到与 cuBLAS 相当的性能。

虽然 Triton 架构目前只正式支持英伟达 GPU,但之后也会支持多家硬件供应商。

因为它是开源的。比起闭源的 CUDA,其他硬件加速器能直接集成到 Triton 中,大大减少了为新硬件建立 AI 编译器栈的时间。

无论是谷歌还是 OpenAI,在 AI 领域无疑比英伟达更专业,它们欠缺的只是时间。

更何况,前文已经说了,AI 所需算力每 100 天将翻一倍。

也就是说,到 2030 年,AI 所需算力是现在的 3000 万倍。(2 的 25 次方)

即便是英伟达,也不可能满足如此恐怖的需求增长。

叠加全球供应链安全的考量,AI 芯片市场从过去的英伟达一家独大,或慢慢转变为群雄割据。

还有另一种情况。

如今,AI 一日千里,技术突破以小时计。如果在未来,AI 在社会上的普及能像 PC 和手机那样大幅提升,算力成本可能大幅下降

那时,GPU 更不是唯一的答案。

03

尾声

回顾历史,一战和二战,赢家是谁?从生意的角度看,是美国。

作为军火商,美国通过贩卖武器,实现了财富自由。

而今,多维度的人工智能战争已经打响,英伟达扮演的就是曾经军火商的角色。

目前,在 eBay 上,一张 H100 的售价,基本都在 4-5 万美元。而在一年前,才一万多。

而且有价无市。

据国内渠道商透露,之前拿货周期大约为一个月左右,现在基本都得三个月,甚至更长。

" 一台通用计算服务器的成本大约在 5 万块钱左右,现在符合美国技术出口规范的 A800 一块价格已经涨到十几万,对于投入算力基础设施的公司来说,整个采购成本都在增加。"

好家伙,二道贩子卖一张卡的利润,顶俺们上一年班。

这有点类似两年前的动力电池,享受量价齐升的逻辑。你总以为到顶了,其实远远没有。(参考阅读《世纪抄底英伟达》)

但这种垄断式中间商,还能爽多久呢?

复盘英伟达过去二十年,通俗点讲,只需做好游戏 GPU,就能顺带提高算力,满足训练 AI 模型需要,一举两得。

所以英伟达发展得快,从一个二线芯片公司变成了行业的 NO.1,不可谓不励志。

但当 AI 大模型进入高速发展阶段,英伟达的侧重点,从游戏转向并非自己专长的人工智能。固然能在前期垄断上游算力,赚得盆满钵满,但早晚会被更专业的玩家追赶上。

你说它是 AI 时代的卖水人,没问题。说市值万亿美元不是它的终点,也没问题。

但要说它是 AI 时代唯一的霸主,那就不尽然。

再如日中天的帝国,也要当心那道不起眼的裂缝。

本站所有文章、数据、图片均来自互联网,一切版权均归源网站或源作者所有。

如果侵犯了你的权益请来信告知我们删除。邮箱:dacesmiling@qq.com

标签:
微信

三青

当你还撑不起你的梦想时,就要去奋斗。如果缘分安排我们相遇,请不要让她擦肩而过。我们一起奋斗!

微信
阿里云