18956674556

南宫英伟达慌了大客户要丢?发布日期:2024-04-14 02:50:42 浏览次数:

  跟着AI周围的竞赛日趋激烈,高本能AI芯片仍然成为商场上的炙手可热之物,科技巨头也正正在寻找人工智能所需的稀缺芯片,开脱依赖,加快竞赛。

  Meta正在一篇本领博客中示意,MTIA 是其恒久方针的紧急构成个别,该方针旨正在缠绕奈何正在其任职中运用人工智能来构修根蒂步骤。它指望计划的芯片不妨与其眼前的本领根蒂步骤和 GPU 的另日进取相配合。杀青咱们对定制芯片的宏愿意味着不但要投资于盘算推算芯片,还要投资于内存带宽、搜集和容量以及其他下一代硬件体系。

  昨年5月,Meta公布了MTIA v1,采用台积电7nm工艺本领。而这回MTIA v2属于MTIA v1的升级版,采用了台积电5nm工艺本领,而且正在物理计划方面举办了升级,MTIA v2的面积增进13%,具有更众的措置中枢,功耗从25W晋升到了90W,时钟频率从800MHz进步到了1.35GHz。每PE缓存从上一代的128KB增进到384KB,INT8精度下的茂密算力到达上一代的近3.5倍,稀少算力到达上一代的近7倍,到达708TFLOPS。

  昨年10月,该公司示意将向接济人工智能的根蒂步骤参加高达350亿美元,搜罗数据中央和硬件。其首席践诺官扎克伯格当时对投资者示意:“人工智能将是咱们2024年最大的投资周围。”

  本年1月18日,扎克伯格曾高调布告,Meta正正在方针构修我方的AGI(通用人工智能),方针正在本年年末前取得约35万块来自英伟达的H100 GPU,再算上其他GPU,公司具有的算力总和将切近于60万块H100所能供给的算力。尽管遵从明星芯片H100的最低售价25000美元来盘算推算,Meta仍将为35万块H100支拨约87.5亿美元的支拨。

  为下降对英伟达等芯片厂商的依赖,Meta并不是唯逐一家将眼光转向自研AI芯片的科技巨头。

  正在4月9日晚的 Vision 2024 举止中,英特尔公布了新一代 Gaudi 3 AI 芯片,并将于 2024 年第三季度通过 OEM 体系大量量上市。

  据先容,新款 Gaudi 3 与英伟达 H100 比拟操练本能进步了 170%,推理才力进步了 50%,恶果进步了 40%,但本钱却低得众。

  Gaudi 3 AI 加快器采用 5nm 工艺打制,FP8 本能是上一代产物的两倍,BF16 本能是上一代产物的四倍,搜集带宽是上一代产物的 2 倍,内存带宽是上一代产物的 1.5 倍,并供给 Mezz 卡、板载和 PCIe 三种形状。

  的确来看,英特尔 Gaudi 3 与合键的竞品英伟达 H100 正在好像节点数目下,联系大模子操练功夫比较上至高有 1.7 倍上风,此中,LLAMA2 70 亿参数比较有 1.5 倍于 H100 的上风,LLAMA2 130 亿参数最高有 1.7 倍的上风,GPT 3 1750 亿参数有 1.4 倍上风。推理速率和能效显露上,Gaudi 3 比拟于 H100 也有较大幅度晋升。

  英特尔正在 Vision 2024 上也宣布了 Gaudi 3 坐蓐节点,2024 年一季度将率先推出风冷版样品,二季度推出液冷版样品,并正在本年第三、第四序度区分批量交付风冷版和液冷版。Gaudi 3 将由戴尔、惠与、联念和超微四家 OEM 供给。

  4月9日,谷歌正在本年的年度云盘算推算大会Cloud Next 2024上布告推出一款基于Arm架构的数据中央芯片Google Axion,以及更新TPU v5p芯片。

  谷歌示意示意,Google Axion措置器基于Arm Neoverse V2 CPU构修,以Titanium为根蒂,本能比通用ARM芯片高30%,并且比英特尔坐蓐确当前一代 x86芯片高50%。估计Axion用于众种谷歌任职,并正在“本年晚些时辰”向民众怒放。

  谷歌云副总裁兼盘算推算和呆板研习根蒂步骤总司理 Mark Lohmeyer 示意:“咱们正正在让客户轻松地将现有办事负载转化到 ARM。Axion 创办正在怒放根蒂之上,正在任何地方运用ARM的客户都能够轻松采用 Axion,而无需从头架构或从头编写利用圭外。”

  “谷歌推出的新型 Axion CPU 符号着交付定制芯片的一个紧急里程碑,该芯片针对谷歌的根蒂步骤举办了优化,并构修正在咱们的高本能 Arm Neoverse V2 平台上。数十年的生态体系投资,再加上 Google 的赓续更始和开源软件进献,确保为正在各地运转 Arm 的客户最紧急的办事负载供给最佳体验。”Arm 首席践诺官 Rene Haas示意。

  毕竟上,Axion 只是稠密定制发一份芯片中的最新产物。自2015年往后,谷歌仍然公布了五代张量措置单位(TPU);同时,2018年,谷歌公布了第一个视频编码单位 (VCU),视频转码恶果进步了33 倍;其它,2021年,谷歌通过投资“片上体系”(SoC) 计划,加大了定制盘算推算的参加,并公布了用于转移摆设的三代Tensor芯片中的第一款。

  谷歌CEO桑达尔·皮查伊示意,天生式 AI的进取需求巨大的底层根蒂步骤。谷歌 AI 超等盘算推算机纠合了咱们的 TPU、GPU、AI 软件等,为操练和任职模子供给本能和本钱上风。此刻,领先 AI 公司和 Google Cloud 客户(比如 Anthropic、AI21 Labs、Contextual AI、Essential AI 和 Mistral AI)正正在运用其根蒂步骤。

  数据显示,固然广告已经是谷歌最大收入源,但云盘算推算的增进更速,正在谷歌的收入中占比一向进步,已切近占公司总收入的11%。据Gartner估算,2022 年,谷歌占云根蒂步骤商场 7.5% 的份额,而亚马逊和微软合计负责着 62% 足下的份额。

  谷歌示意,现正在仍然有跨越 90% 的 AI 独角兽企业正在运用谷歌的盘算推算资源、模子和拓荒处境。

  有评论称,谷歌拓荒新芯片是正在 AI 竞赛白热化之际裁汰对外部厂商的依赖。谷歌掌握自研芯片营业的副总Amin Vahdat示意:“我感到这是做大蛋糕的根蒂。”

  除了Meta、英特尔、谷歌,亚马逊AWS早正在2018年便推出Graviton芯片,并于2023年推出AI芯片Trainium2;微软也于昨年11月公布了自研AI芯片Maia 100和Cobalt 100南宫。越来越众的科技巨头出手自行研发芯片,试图开脱对高本钱AI芯片的依赖性。然而,理会以为,这一流程不会速捷完毕,由于到目前为止,这些发奋并没有弱小业界对英伟达人工智能加快器的茂盛需求。