搭载华为自研芯片的DeepSeek - R2将至,美国或面临挑战
年初DeepSeek R1的问世就曾让美国AI圈震动,甚至引发了NVIDIA的股价暴跌。如今,更强的DeepSeek - R2即将到来,且全部基于华为芯片,这的确可能会让美国感到担忧,以下从多个方面进行分析:
技术参数优势显著
参数量大幅提升
DeepSeek - R2大模型预计将采用更先进的混合专家模型(MoE),结合更智能的门控网络层(Gating Network)来优化高负载推理任务的性能。其模型总参数量预计达到1.2万亿,相较于DeepSeek - R1(6710亿参数)提升约1倍,在规模上与ChatGPT的GPT - 4 Turbo以及谷歌的Gemini2.0 Pro相当。
芯片性能出色
DeepSeek - R2训练全程未使用NVIDIA显卡,而是全部基于升腾910B(Ascend 910B)芯片集群平台。在FP16精度下,计算性能达到512 PetaFLOPS,芯片利用率高达82%,整体性能约为NVIDIA上一代A100集群的91%。
成本优势明显
DeepSeek - R2的单位推理成本较OpenAI旗下的GPT - 4大减97.4%。其中,输入每百万个字符仅需0.07美元,而输出每百万个字符仅0.27美元,展现出了极高的性价比。
对美国科技产业的影响
芯片市场冲击
当下中美科技战、贸易战愈演愈烈,NVIDIA H20芯片面临新一波出口管制。而DeepSeek - R2摆脱NVIDIA芯片,使用华为升腾910B芯片进行训练,市场预期这有望降低中国对海外高端AI芯片的依赖。并且华为全新的升腾910C芯片也开始进入大规模量产阶段,CloudMatrix384超节点采用384颗升腾910C芯片,或将成为英伟达NVL72集群的替代方案,这无疑会对美国的芯片产业,尤其是NVIDIA等企业造成巨大的冲击。
引发市场质疑
如果DeepSeek - R2如传闻般强势,可能再次引发市场对AI基础设施需求的质疑。原本依赖美国芯片构建AI基础设施的观念可能会被打破,更多的企业和机构可能会重新评估芯片的选择,这对美国在AI芯片领域的主导地位提出了挑战。
战略层面的影响
自主可控能力增强
DeepSeek - R2基于华为自研芯片进行训练,体现了中国在人工智能领域的自主可控能力不断增强。在面临美国科技封锁的情况下,能够依靠自身的技术力量发展先进的大模型,减少对美国技术和产品的依赖,这对于中国科技产业的长远发展具有重要意义。
国际科技竞争格局变化
DeepSeek - R2的出现可能会改变国际科技竞争的格局。中国在大模型和芯片领域的进步,使得美国在科技领域的领先优势不再那么明显,未来在人工智能等前沿科技领域的竞争将会更加激烈,美国需要重新审视和调整其科技战略