努力加载中
  • 推荐
  • 要闻
  • 财经
  • 娱乐
  • 时尚
  • 情感

热点推荐

热门图文

DeepSeek、华为、出口管制以及中美人工智能竞赛的未来
人工智能学家

本文来源:启元洞见

导语:2025年3月7日,美国战略与国际研究中心(CSIS)发布了题为《DeepSeek、华为、出口管制以及中美人工智能竞赛的未来》(DeepSeek, Huawei, Export Controls, and the Future of the U.S.-China AI Race)的报告,报告就DeeepSeek取得的成功,形成了关于DeepSeek、华为、出口管制以及中美人工智能竞赛的未来的判断。启元洞见编译核心内容,旨在为读者了解中美人工智能博弈现状和重要战略问题提供参考。

引言

DeepSeek-R1模型的发布促使全球重新评估人工智能竞争格局。投资者对中国科技企业的关注度已显著提升且持续高涨。

本文概述了DeepSeek的起源和成就、其地缘政治影响,以及由此给美国及其盟友的政策制定带来的关键挑战。以下关于DeepSeek、华为、出口管制以及美中人工智能竞争未来的关键判断。


01

DeepSeek并非凭空诞生。其母公司幻方量化在人工智能驱动的量化交易领域有着深厚根基,这在计算基础设施和人才储备方面都为其提供了坚实基础。

幻方量化是一家依靠数学与计算机科学进行量化投资的对冲基金公司由梁文锋于2015年创立,2019年列中国顶尖对冲基金。在算法交易领域有深厚积累,购置大量英伟达芯片、建数据中心。DeepSeek受其传承影响,算法交易与人工智能研究领域存在技术技能协同效应。

02

就性能和成本而言,DeepSeek的技术成就并不令人意外,反映了长期趋势的延续。

DeepSeek在技术性能上的提升与人工智能性能增长的既有趋势一致。它们代表的是预期的性能突破,而非颠覆性颠覆。从宏观层面看,改进动力可分为三类:提升可用算力资源、优化算法与架构、提高训练数据的质量与数量。人工智能研究者显然尚未触及计算性能与效率的绝对天花板。而实现这些关键技术突破的研究机构来自中国,且其核心技术团队似乎完全由中国本土培养,而非来自西方高校或企业,这点让西方国家感到意外。


03

DeepSeek的技术创新是真实的,所有技术成果均经过西方研究人员的复现验证。

美国高校研究人员已成功复现DeepSeek V3和R1论文中的部分研究成果,美国人工智能企业正着手将DeepSeek的创新技术整合至自身研发体系。DeepSeek几乎所有技术创新均聚焦于算法与架构改进。其研发过程既未依赖高性能计算硬件,也未使用能形成竞争优势的特殊数据集(合成数据除外)。DeepSeek在发布的系列论文中展现的核心技术突破意义重大。


04

DeepSeek的成功反映了2022年10月美国首波人工智能芯片出口管制政策的滞后效应。美国政府已于2023年10月更新管制措施以弥补部分缺陷。

DeepSeek的V3论文披露其模型训练耗时2,788,000GPU小时,采用英伟达H800芯片。H800芯片是英伟达为符合美国2022年10月7日出口管制要求,专为中国市场开发的降级版H100芯片。拜登政府最终意识到A800/H800的持续对华销售将导致出口管制政策失效,但直至12个月后(即2023年10月)才正式升级管制措施,将A800/H800及性能相当的非英伟达芯片纳入禁售范围。


05

DeepSeek面临的挑战也反映出美国人工智能芯片出口管制政策的成效。

自2022年人工智能芯片短缺以来,英伟达销往中国的每一枚芯片都需要从其他地区(主要是美国客户)调配。换言之,取消出口管制不仅利好中国,也会损害美国——至少在英伟达芯片分配层面如此。DeepSeek创始人梁文锋对出口管制的认知清醒:他在2024年7月访谈中表示,“我们短期内没有融资计划。资金从不是问题,先进芯片断供才是症结”。核心结论不变:算力规模决定上限


06

DeepSeek在提升人工智能计算效率领域的技术突破,可能对美国企业的助益远超中国企业,因其可将相同技术应用于更庞大的算力资源,从而为更多用户提供优质人工智能服务。

DeepSeek的所有创新均属算法与架构层面,且已在研究论文中详尽披露。这意味着美国人工智能实验室可自由采用这些创新来训练部署自家模型,事实上美国企业已在实践。但DeepSeek难以复制美国的芯片与算力优势。受极紫外光刻(EUV)技术限制,中国最先进的人工智能芯片设计商(华为)与逻辑芯片制造商(中芯国际)或将在7纳米甚至存在缺陷的5纳米制程节点停滞多年。


07

正如过去六十年摩尔定律推动计算机芯片需求增长,DeepSeek及其他人工智能能效创新将继续刺激人工智能芯片需求。

效率提升使得数字计算在经济活动中的应用更具吸引力,促使更多政府、企业与消费者在各类场景中增加算力投资。这正是杰文斯悖论(Jevon’s Paradox)的核心:效率提升反而刺激总需求增长。出口管制的影响将在未来显现:随着算力规模呈十倍、百倍、千倍级扩张,中国面临严峻的技术封锁,而美国则能通过持续进步扩大领先优势。


08

DeepSeek成功,引发了关于“在知识产权保护薄弱环境下竞争优势本质”的战略思考。

知识蒸馏(distillation)是通过“教师模型”(大型复杂模型)的输入输出数据训练“学生模型”(更小但高效的模型),简而言之,学生模型会将教师模型的输入输出数据作为极高质量的合成训练数据加以利用。通过模型蒸馏提供更小巧、更高效的版本,从而以更快速度、更低成本为客户提供服务。当一家公司对自己的模型进行蒸馏时显然是无害的,但若某公司能对另一家公司的模型进行蒸馏,则存在战略风险,这样能以远低于自主研发的成本,获得高性能人工智能模型的大部分,甚至全部优势。对于OpenAI和其他美国人工智能企业而言,具有战略意义的真问题在于美国企业是否具备有效机制,能够防止任何竞争对手在不承担成本的情况下攫取成果。若美国人工智能企业无法阻止竞争对手以极低成本获取其技术成果,其竞争优势将难以维系。


09

近年来的发展态势表明,在涉及人工智能领域时,传统知识产权保护与技术机密的常规手段恐难奏效。

尽管学界正研发防模型蒸馏技术,人工智能企业也必将加强防范,但知识产权保护问题仍存重大悬念。即便能有效防范蒸馏与技术间谍行为,推理算力问题仍难解决,这需要投入更多计算资源使模型思考得更深入,或支撑模型更频繁地调用以服务更多用户。换言之,不妨这样理解:人工智能领域的竞争优势本质,正从“保守机密”(如模型权重参数)转向“掌控资产”(如超大规模数据中心算力基础设施)。这意味着,若能有效实施并执行出口管制,仍可对竞争格局产生战略性影响。


10

出口管制的有效性将取决于能否有效实施并落实执行,若特朗普政府削减相关政府资源和人员编制,或导致盟国拒绝配合,这一环节着实令人忧心。


11

美国面临的最大战略挑战是中国可能在国内生产出足够数量和质量的人工智能芯片,从而构建与美国竞争的人工智能数据中心基础设施。

人工智能领域的地缘政治优势正在从难以保护的软件机密,转向有望更易保护的硬件芯片和数据中心资产。从这个意义上说,真正的挑战在于中国可能建立本土人工智能芯片生产生态系统,并将这些芯片集成到数据中心中用于模型训练,同时为DeepSeek及其他人工智能模型提供推理支持。


12

DeepSeek之所以在人工智能模型开发商中脱颖而出,关键在于其展现出在英伟达CUDA软件生态底层实现架构创新的能力。若DeepSeek全力强化华为昇腾(Ascend)芯片及CANN软件生态,将对英伟达构成更严峻的威胁。

从历史经验看,英伟达最大的竞争优势之一正是其CUDA(统一计算设备架构)软件生态。该生态极大简化了程序员编写大规模并行软件的难度,并确保前后代芯片与软件的兼容性。任何试图弃用英伟达芯片的客户都不得不脱离CUDA生态,这意味着需要自行解决CUDA已免费提供的诸多复杂软件难题。

DeepSeek实现了CUDA层之下的软件革新。多数人工智能研究者依赖CUDA这一面向英伟达GPU的高级编程语言,因其能简化开发流程。但CUDA无法满足DeepSeek所需的GPU操作细粒度控制。为此,DeepSeek通过PTX实现高效的线程调度、内存优化和寄存器管理,从而最大化GPU的计算性能。这表明DeepSeek可能同时具备技术实力与开源社区号召力,最终推动华为CANN(神经网络计算架构)生态形成发展势头。


13

华为的人工智能芯片设计实力长期居于领先地位。在2020年出口管制实施前,凭借台积电的制造能力以及中国政府优先采购华为产品的政策导向,华为有望在中国市场对英伟达形成实质性挑战。

在中国国内市场中,华为凭借昇腾人工智能芯片产品线无疑占据人工智能芯片设计的最强地位。目前华为昇腾产品线聚焦于昇腾910B和910C,后者每个集成单元包含两颗910B逻辑芯片。据报道,DeepSeek评估认为昇腾芯片虽不适合训练人工智能模型,但每颗910C在人工智能模型推理任务中能达到英伟达H100约60%的性能。这一差异至关重要,因为未来数年高级人工智能模型的计算需求将越来越多向推理环节倾斜。


14

受美国及其盟友出口管制影响,华为的人工智能芯片制造合作伙伴中芯国际(SMIC)在突破7纳米以下制程的道路上,仍面临艰巨挑战。

目前中芯国际与华为正致力于实现5纳米制程的量产,但缺乏极紫外(EUV)光刻机供应商且出口管制禁止此类设备对华销售。


15

消息人士向CSIS透露,中芯国际最重要的客户华为已成功将芯恩、鹏新旭及华为东莞工厂囤积的美制设备转移至中芯国际SN2产线。


16

随着国产设备替代计划取得突破,中芯国际预计到2025年底将实现7纳米月产能5万片晶圆(WPM)。若全部产能用于生产昇腾人工智能芯片,理论上可年产数百万颗昇腾910C芯片。但实际可能性较低。

这批设备将消除中芯国际SN2工厂7纳米产线面临的短期美制设备瓶颈。假设全部产能用于昇腾910C制造,每月可产出400万颗910B芯片裸片(其中80万颗全功能芯片),理论上可封装成40万颗910C芯片。但现实中中芯国际不太可能将所有7纳米产能分配给昇腾芯片。华为还需该制程产能满足智能手机、笔记本电脑、数据中心及通信设备的芯片需求,且中芯国际还需服务其他客户。但可以确定的是,华为近期将大幅提升昇腾芯片产量。


17

华为昇腾芯片目前仍面临配套人工智能软件生态不足的挑战,导致已采购芯片利用率低下。但若DeepSeek开源社区的活跃度能提升华为CANN软件生态竞争力(对标英伟达CUDA体系),这一局面或将改观。

有报告指出,当前算力短缺更多源于实际部署问题:大量中小型数据中心闲置与超算集群未充分使用,而非芯片绝对数量不足。近期中国政府推行“闲置算力上云”等政策调整,叠加头部科技企业优先采用DeepSeek模型的战略转向,预示着这一状况可能很快改善。


18

尽管在大规模芯片集成与软件框架适配方面仍面临挑战,华为与DeepSeek完全具备构建百万级昇腾芯片人工智能超算集群的可行性。

在华为与中国政府支持下,DeepSeek很可能成功整合中国境内现有英伟达H800/H100芯片构建新型人工智能训练数据中心,再通过部署规模更大的昇腾910C集群强化推理能力。这种:“混合算力”模式或将助力中国在人工智能领域持续取得重大进展。


19

美国企业在通往人类级通用人工智能(AGI)及超人类智能(ASI)的竞赛中仍保持领先,但优势已显著收窄。即便实施极端严厉的出口管制,技术代差也很难维持超过一至两年。

若无出口管制,中国企业在前沿人工智能模型研发部署方面可能早已反超美国。昇腾芯片本有望实现大规模商用。出口管制确实有效延缓了中国技术崛起与自主化进程,且随着英伟达Blackwell新一代芯片面世,而中国可能长期受困于7纳米制程(除非突破国产EUV光刻技术),这种压制效应将持续放大。

但中国通过政府在资金、人才、政策以及实质性自主创新形成的组合拳不容小觑。尽管美国企业凭借全力投入与固有优势仍可能率先突破人类级通用人工智能及超人类智能,但这一结果绝非必然。正如华为手机在重重封锁下仍实现5G芯片突破所证明的,技术封锁反而可能加速中国创新能力的蜕变。

相关推荐
x