刚刚结束的COMPUTEX电脑展上 ,英伟达CEO黄仁勋笑着对听众说,“你(芯片)买得越多,赚得越多 。”引来一阵笑声。
这句话的背景是 ,全球科技厂商在AI热潮下继续重金投入建设数据中心或算力中心。黄仁勋在演示文档上写着,英伟达正在驱动全球万亿美元级别的企业AI IT投资 。
数据中心建设热潮下,现在看来 ,AI算力需求的变化与年初一些业内人士预计的不太一样。DeepSeek对训练算力资源的节约,并未让整体算力需求减少。
不过,还有一个变化发生了,随着DeepSeek推动AI走向应用 ,用于推理的AI芯片占比正在升高 。
市场研究机构IDC中国副总裁周震刚告诉第一财经记者,2024年中国数据中心加速卡中已有半数以上是推理卡,DeepSeek出现后 ,今年推理芯片占比预计还会增加。
这种芯片结构变化,可能会对AI芯片市场造成深远影响,特别是在中国市场。推理环节对AI芯片性能等的要求较低 ,国产AI芯片也可以使用,在英伟达出口受到限制的情况下,可能促成国内AI芯片的组成发生变化。
周震刚透露 ,去年国内数据中心加速卡市场中,国产算力占比大约三成,预计今年上半年占比应该会超四成 。
第一财经记者了解到 ,这波数据中心或算力中心建设潮中,需求方来自高校、企业等,AI应用十分多元。而面向算力需求的变化,已有算力中心在计划调整芯片 ,使芯片组成更加多元 、向模型推理倾斜。
算力需求来自哪里
数据中心或算力中心建设还在进行 。IDC数据显示,中国加速计算服务器市场出货量2024年同比增长97.3%,预计2025年增长52.9%。
在中国招标投标公共服务平台 ,第一财经记者以智算中心为关键词搜索中标信息发现,截至今年5月26日,今年国内智算中心中标信息123条 ,是去年前5个月的2.2倍。这些信息围绕智算服务器设备采购、运维服务、电力模块采购 、勘探、基建供配电工程施工等 。
从中标信息数量看,国内智算中心建设提速是持续的过程。2023年国内智算中心中标信息53条,2024年猛增至213条。2024年上半年中标信息71条 ,下半年增加至142条,显示当年建设项目也在增多 。
记者了解到,一些企业和高校有了更多算力需求 ,部分高校自购算力卡,部分购买云算力或超算中心算力。
香港科技大学冯诺依曼研究院院长贾佳亚告诉第一财经记者,学校此前购买了一批英伟达H800计算卡,香港只有香港科技大学有相对较多的H800 ,这是能将该研究院做成较大规模的背景。即便如此,有算力提供方告诉记者,该校在训练大模型 ,需求比较大,自己的算力不够,也需要其他算力来源 。
近日华东理工大学则与腾讯云合作 ,推动AI与学科融合及科学研究降本增效等。该校副校长王慧锋告诉记者,高校科研对AI算力的需求增长是必然,该校也在探索AI+科学研究 ,例如有化学老师将AI算法用于锂电池催化设计,并将设计理念提炼出来做成智能体知识库,用于实践教学。目前学校采用混合云架构 ,部分算力本地化部署,另有大量计算放到云上,上云而不是完全自建机房的做法成本更优。王慧锋告诉记者,考虑到需求和数据安全等 ,目前高校采用私有和混合架构的模式是主流 。
去年12月,香港规模最大的数码港人工智能超算中心投入服务,香港为申请使用者提供资助。记者了解到 ,申请使用该超算中心首阶段算力的主体就包括大学和科研机构。
数码港行政总裁郑松岩告诉记者,该超算中心目前有1300PFLOPS算力,第二阶段规划算力是1700PFLOPS ,今年10月该超算中心算力将提升到3000PFLOPS 。目前已审批通过10个申请,这些申请来自大学、科研机构 、企业,用途包括学术研究、生物医疗、材料分析、大模型应用等 ,到本月底,第一阶段的算力使用率将超95%,预计接下来的申请会越来越多。
“一些大学在做教学相关项目 ,一些在研究可商业化的项目。有的大学在研究生物科学相关领域,也需要比较大的算力 。目前不少大学是以开发项目为主来申请,个别大学会捆绑几个小项目一起申请,让学生做一些研究。现在有算力基本是先到先得。 ” 郑松岩表示 。
企业也需要算力。郑松岩告诉记者 ,企业应用处于刚开始尝试的阶段,可以感受到很多企业还没有下很大决心要完成整个机构的转型,或为此拟定非常严格的时间节点。“前段时间处于一种想用AI ,但很多企业还没启动的阶段 。很多企业都想用AI来提高效率 、降低成本,但AI要直接嵌入企业日常流程中,企业实际上缺乏相应人才配套。”郑松岩表示 ,香港的人工智能应用爆发期还没到来,随着业界对AI越来越熟悉,接下来预计应用会越来越多。
算力向推理倾斜
DeepSeek带来的算力需求增长 ,是大模型推理对大模型训练的一场“胜利”。过去两年,大模型业界最受关注的一直是训练环节 。但开源且性能出众的DeepSeek-R1面世后,更多人开始真正将大模型用起来 ,促使推理需求增长。
这让一些适合推理的芯片用了起来。周震刚向记者表示,去年国内互联网公司、电信运营商采购了大量国产算力卡,但去年采购方发现,国产算力资源不是很好出售 。而随着今年上半年DeepSeek应用推开 ,尤其是国产算力适配DeepSeek后,此前它们采购的国产算力在今年第一季度已经被DeepSeek占有了。目前电信运营商已在建设新的大规模算力中心,包括基于国产算力的万卡集群。
腾讯是国内最早接入DeepSeek的互联网厂商之一 。该公司在5月的业绩交流会上释放过推理需求增长的信号。
腾讯管理层表示 ,腾讯有足够的高端芯片来继续训练模型,公司看到对GPU更大的需求是在推理侧。用户推理需求逐渐增长,推理token(词元)的需求比之前预计的更多 ,AI需求已经超过了GPU资源(所能提供的算力) 。
周震刚也发现,DeepSeek出现确实让算力需求改变了,主要是改变了算力需求的结构。他告诉记者 ,2024年,中国数据中心加速卡有57.6%是推理卡,33%是训练卡。而在DeepSeek出现后 ,一些小型公司的算力从训练转到推理 。腾讯、百度这类平台接入DeepSeek也大大推动了推理芯片的增长,因此预计2025年推理芯片占比还会进一步大幅增加。
郑松岩告诉记者,数码港的人工智能超算中心也在考虑改变算力组成。
“一开始我们主要面向模型训练需求,包括很多大学那时候要做模型训练 ,但实际上,近一年来模型变化很大。 ” 郑松岩告诉记者,此前很多机构在做基础大语言模型 ,但在DeepSeek出来后放弃了这一路线,转向使用DeepSeek等基础大模型,“我们认为未来做基础大模型的团队会逐渐减少 ,转向以推理为主,人工智能超算中心的第二阶段正在建构中,接下来做安装 、配置、设计时会更多考虑这部分需求 。”
郑松岩告诉记者 ,推理环节对芯片算力的要求相对没那么大,因此,算力不及英伟达H100、H800的芯片都有可能引进。
芯片组成变了
推理需求增长让国产算力站上竞技的舞台了。
周震刚告诉记者 ,2022年和2023年,英伟达占中国数据中心加速卡市场的85%~90%,国产算力没有太大空间,但在美国政策 、国内市场变化等因素影响下 ,国产算力占比已有大幅提升 。
具体而言,2024年中国数据中心加速卡市场中,有65.2%是英伟达 ,34.6%是国产算力。“我们现在看到,今年上半年国产算力占比应该会超四成,很可能在很短的时间内 ,国产算力会成为主流,占比超50%。这个比例在两年前是无法想象的 。”周震刚表示。
在大模型算力需求以训练为主的时候,之所以国产芯片还难以挑战英伟达的地位 ,既有英伟达芯片算力高、生态好、集群大等原因,也有训练难以兼容异构芯片的原因。周震刚向记者解释,训练时难以同时用英伟达+国产芯片组成的资源池 ,只能将训练分成两部分,一部分用英伟达卡,一部分用国产卡,但这种训练的效率较低 ,因此大部分训练现在仍跑在英伟达卡上,只有少数AI厂商基于国产卡算力平台,更多厂商还是在用国产芯片做测试性工作 ,作为备用方案 。但推理可以跑在国产芯片上,“可以根据需求,把面向某个应用的推理或面向某个区域用户的推理放到国产芯片上 ,可以这么分解。 ”
“过去别人会问(国产芯片厂商),你跟英伟达H100相比优势在哪里 、性价比如何、生态能否兼容?现在这些问题已经没有太大影响了。”有业界分析人士向记者形容,云厂商或AI厂商现在需要英伟达之外的更多国产芯片方案 。除了华为与运营商合作 ,其他国内芯片厂商也基本都有芯片出来了,云厂商也在推进自研。周震刚表示,今年一季度需求火热的DeepSeek一体机中 ,英伟达芯片占比还是较大,但已有不少基于寒武纪、沐曦等国产芯片。
需求也反映在国产AI芯片厂商业绩上。此前陷于亏损的寒武纪,2024年第四季度开始盈利 。今年第一季度,寒武纪营收11.11亿元 ,接近去年全年营收,净利润3.55亿元,实现同比扭亏。
还有算力中心正在考虑国产芯片方案 ,郑松岩告诉记者,推理不需要用到太“高级”的芯片。数码港有一个人工智能实验室,正在测试不同的芯片 ,除了英伟达,还测试国产的华为 、沐曦、壁仞、昆仑芯等 。同时,实验室也在测试异构算力调度平台 ,希望能通过一个平台统一调度不同芯片算力。
腾讯高管则在5月的业绩交流会上表示,公司会同时看进口芯片和国内市面上可用的芯片,在某些情况下 ,其中一些芯片能做较小模型的推理。
作为AI芯片巨头,英伟达近期感到紧张不是没有道理的 。今年4月,英伟达公告称,美国政府已告知 ,对于H20芯片及达到H20内存带宽等的其他芯片,若出口至中国等国家和地区需获得许可证。H20是英伟达针对中国市场推出的“特供”版本。
黄仁勋近日表态称,这种人工智能芯片出口管制是失败的 ,“事实证明,最初制定人工智能扩散规则的那些基本假设存在根本性缺陷 ” 。他表示,英伟达在中国市场的份额已从美国前总统拜登执政初期的95%降至目前的50%。中国人工智能市场规模可能在未来两到三年内达到约500亿美元 ,对一家美国公司来说,无法进入这一市场将是巨大的损失。
英伟达还在尝试应对中国市场上的竞争 。近日有消息称,英伟达拟新推出一款面向中国市场的AI芯片 ,采用最新的Blackwell架构,定价低于H20,最早于今年6月量产 ,英伟达官方尚未证实该消息。
(文章来源:第一财经)
成都配资网:股票配资的正规平台-AI模型首次出现“抗命不遵”!AI安全公司称OpenAI o3模型出现异常
股票配资资质:配资平台查询-AI芯片重大突破 大语言模型能耗减半!机构扎堆看好11股增长潜力
哈尔滨配资公司:炒股配资平台开-端午小长假前夜火车票今日开抢 多个技巧提高购票成功率
炒股杠杆软件有哪些:股票配资平台官网平台网址-“小接口”大生态 国产手机巨头联手推动快充标准化
配资:深圳股票配资公司-盈康生命CMEF首发AI创新应用平台,重构医疗服务新生态
配资:炒股10倍杠杆平台-公募基金费率改革又进一步!多家公募官宣,自3月21日起这笔费用由公司承担
盛达优配提示:文章来自网络,不代表本站观点。
杨方配资-杨方配资APP-咸阳股票配资-炒股配资官网首页^感恩回馈,共享成功喜悦:我们深知投资者的信任与支持是平台发展的基石。因此,在投资者取得投资成功时,我们也会通过各种方式表达感激之情,与投资者共享成功的喜悦与成果。
3月24日,易方达国证自由现金流ETF公开发售。该产品跟踪国证自由现金流指数,这个指数是什么?有哪些优势?投资价值如何?...
记者辛圆3月25日,博鳌亚洲论坛旗舰报告《亚洲经济前景及一体化进程2025年度报告》(以下简称《报告》...
截至2025年4月10日 10:29,国证自由现金流指数(980092)强势上涨2.42%,成分股欧圣电气上涨、环旭电子...
记者王珍中国国际经济交流中心副理事长、国务院发展研究中心原副主任王一鸣周一在“中国发展高层论坛2025...
记者|赵阳戈年初,证监会就修改《证券发行与承销管理办法》部分条款向社会公开征求意见,市场也将注意力投向了...