大家好,欢迎来到IT知识分享网。
日前,英伟达的股价再次迎来上涨,总市值超过 2 万亿美元,成为继苹果(2.83 万亿美元)和微软(3.06 万亿美元)之后第三家估值超过 2 万亿美元的美国公司[1]。
该公司之所以在过去一年里取得如此迅猛的市值增长,主要是因为其在 AI 芯片市场发挥的领先作用。
显而易见,随着以 ChatGPT 为代表的大语言模型的陆续出现,引发了全世界生成式 AI 市场的蓬勃发展。
根据数据统计公司 Statista 提供的数据,预计到 2024 年,生成式 AI 的市场规模将达到 666.2 亿美元,到 2030 年市场规模有望达到 2070 亿美元[2]。
要想构建对于发展大语言模型来说至关重要,并且用于深度学习、大规模模拟和并行处理的应用程序,少不了使用由英伟达开发的 GPU 芯片。
不过,由于种种原因,自 2018 年以来全球芯片一直存在短缺的现象,这给 AI、电子、汽车、医疗等行业的正常生产带来沉重打击。
一面是 GPU 短缺,一面是对生成式 AI 服务需求的持续增长,这种供不应求的态势也让英伟达于 2022 年发布的 H100 芯片极其昂贵,并且,为打造最好的生成式 AI 产品,包括腾讯、微软、Meta 等在内的中美科技公司都在追捧这款 AI 芯片。
其中,需要说明的是,H100 是英伟达继 A100 之后推出的最新旗舰 AI 芯片,它作为 AI 基础设施的核心,具有强大的计算能力,能够帮助训练和部署可以生成文本、图像和音频的大语言模型。
另外,根据 CB Insights 发布的 2024 年生成式 AI 预测报告,一颗 H100 的制造成本大约为 3320 美元,但平均售价已经达到 3 万美元,最高售价甚至一度达到将近 10 万美元[3]。
从另一视角来看,这种囤积芯片的行为,也体现出大型科技公司对英伟达的过度依赖。
在意识到这一点以后,亚马逊、谷歌、微软和 Meta 等科技巨头纷纷构建自己的 AI 芯片,以及通过投资 AI 初创企业等举措,试图摆脱上述依赖,并开始试图抢占芯片市场份额。
具体来说,谷歌部署 TPU(Tensor Processing Units,张量处理器)已经有 8 年时间。
2017 年,该公司发布一款新的专用集成电路产品 TPU,能够支持 AI 神经网络的训练以及训练后的推理。
基于数以万计的 TPU,谷歌成功地构建了自己的 AI 产品,其中就有聊天机器人工具 Bard。
并且,包括 Cohere 在内的其他 AI 公司也在通过谷歌的云服务使用这些芯片,并构建类似的技术。
紧随谷歌之后的亚马逊,分别于 2019 年和 2021 年发布了 Inferentia 和 Trainium 两款芯片。
前者可提供低成本、高通量的机器学习推理,后者旨在训练机器学习模型,包括用于生成式 AI 的模型。
另外,该公司还于 2023 年 9 月给 Anthropic 这家 AI 公司注入 40 亿美元的资金,后者将使用亚马逊的定制芯片来构建 AI 模型。
亚马逊 CEO 安迪·贾西(Andy Jassy)曾在该公司 2023 年第 4 季度财报电话会议中表示:“要获得每个人都想要的 GPU 数量确实很困难。
因此,这也是亚马逊的 Inferentia 和 Trainium 芯片对人们如此具有吸引力的一个重要原因。”
2023 年 5 月和 11 月,Meta 和微软两家公司分别发布了定制 AI 芯片 MTIA 和 Maia 100。
前者是针对 Meta 内部推理工作负载定制的,在性能、延迟和效率方面都具有良好的表现,后者使用 5 纳米工艺制造,能很好地应用于大语言模型的训练和推理。
据了解,在开发和测试 Maia 100 的过程中,微软不仅和 OpenAI 开展了广泛合作,还将基于该产品为后者的 AI 模型提供优化和改进。
事实上,上述公司开发与 AI 有关的定制芯片的行为,有助于它们控制成本、消除芯片短缺,并最终向使用其云服务的企业出售芯片。
正如 AI 初创公司 Nervana 的 CEO 兼联合创始人纳文·拉奥(Naveen Rao)所言:“理论上,如果它们能够达到足够高的产量并降低成本,这些公司应该能够提供比英伟达更好的产品。”
不过,从目前来看,它们在短期之内很难超越英伟达,即便后者开发的芯片价格昂贵,但却是市场上性能最高、能与更多软件完美配合的芯片之一。
亚马逊 AWS 计算和网络副总裁大卫·布朗(David Brown)对媒体表示:“我们还有许多年的艰苦创新要做。”
我们看到各科技公司竞相开发定制芯片,但明显的是,英伟达也不会停滞不前。
参考资料:
1.https://www.theverge.com/2024/2/1//ai-chips-meta-microsoft-google-nvidia
2.https://www.statista.com/outlook/tmo/artificial-intelligence/generative-ai/worldwide
3.https://www.cbinsights.com/research/report/generative-ai-predictions-2024/
https://www.linkedin.com/pulse/amazons-strategic-move-custom-chips-excel-generative-ai-race-greyb-nrblf
https://tickernerd.com/earnings-call/amazon/
https://www.forbes.com/sites/moorinsights/2017/05/22/google-cloud-tpu-strategic-implications-for-google-nvidia-and-the-machine-learning-industry/?sh=1fc67e963af7
https://www.zdnet.com/article/microsoft-unveils-first-ai-chip-maia-100-and-cobalt-cpu/
https://about.fb.com/news/2023/05/metas-infrastructure-for-ai/
https://medium.com/@theeyessource/unveiling-microsofts-groundbreaking-chips-the-maia-100-ai-accelerator-and-cobalt-100-cpu-a00e8ab195ec
https://www.theverge.com/2023/11/15//microsoft-cpu-gpu-ai-chips-azure-maia-cobalt-specifications-cloud-infrastructure
https://unu.edu/article/when-chips-are-down-increasingly-cutthroat-political-economy-computer-chips
https://www.cnbc.com/2023/04/14/nvidias-h100-ai-chips-selling-for-more-than-40000-on-ebay.html
https://www.businessinsider.com/meta-zuckerberg-stockpile-tech-hottest-commodity-nvidia-chips-semiconductors-2024-1
https://www.nytimes.com/2024/01/29/technology/ai-chips-nvidia-amazon-google-microsoft-meta.html
https://www.businesstimes.com.sg/companies-markets/telcos-media-tech/nvidia-market-cap-threatens-alphabet-after-overtaking-amazon
https://dig.watch/updates/amazon-introduces-its-next-gen-ai-chip-intensifying-rivalry-with-microsoft-and-google
运营/排版:何晨龙
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/57420.html