张效羽中央党校(国家行政学院)政治和法律教研部教授
当前,DeepSeek的崛起已经引发全世界的关注。根据测评机构Artificial Analysis的独立分析,DeepSeek-V3可与当前世界顶尖的AI模型竞争。[1]有学者认为,“DeepSeek的突破主要体现在模型和算法创新、软硬件协同优化及整体训练效率的提升”。[2]从更广泛的背景看,DeepSeek的崛起表明中国在人工智能领域已经逐渐突破美国的技术封锁,在一些领域居于领先地位。但我们也要清醒地看到,中国人工智能技术迅速发展仍旧离不开对算力的巨大需求,而DeepSeek的崛起很可能刺激美国政府加强对中国进行相关技术封锁。因此,在DeepSeek崛起之后的“后DeepSeek时代”,我们要立足人工智能技术发展的客观规律,进一步进行法治创新,尤其是针对中国本土大模型发展面临的算力瓶颈和数据瓶颈进行法治创新,运用法治思维和法治手段更好地提升现有算力资源和数据资源的利用效率,更好地为相关企业拓展算力资源和数据资源提供法治支撑,以更高水平的法治保障中国本土人工智能的更高水平的发展。
一、中国本土人工智能的发展仍面临算力瓶颈和数据瓶颈
尽管以DeepSeek为代表的中国人工智能大模型发展很快,但和美西方尤其是美国相比,中国本土人工智能的发展仍面临算力瓶颈和数据瓶颈。算力资源不足和数据资源不足仍旧是困扰中国本土人工智能技术发展的基础性难题,也是中国人工智能技术进一步发展亟待解决的问题。
第一,中国本土人工智能的发展仍面临算力瓶颈。DeepSeek通过优化算法和训练方式,大幅减少了人工智能技术发展的算力需求,使得中国在遭受美国高端算力硬件封锁的情况下能够发展出与美国媲美的人工智能大模型,令人振奋。但振奋之余,我们也要清醒地看到,人工智能技术发展仍需要算力支持。2025年2月18日,美国最新AI大模型Grok3发布,其宣称在多个指标上领先DeepSeek类似模型。[3]Grok3所运用的算力资源远远高于DeepSeek,这说明算力资源与AI大模型智能水平的正向关系(scaling law)依旧存在。因此,中国本土人工智能大模型要获得长足发展,仍旧需要更多的算力资源。不仅如此,面对中国人工智能技术的快速发展,美国政府很可能会进一步加强对中国算力硬件的技术封锁。在这种情况下,算力资源瓶颈仍旧是中国人工智能技术发展面临基础性难题。
第二,中国本土人工智能的发展仍面临数据瓶颈。人工智能技术的发展不仅需要算力资源支撑,也需要数据资源支撑,尤其是需要海量的高质量数据资源支撑。在数据资源方面,世界上大部分数据资源都是英文的,中文资源占比较低。当前,世界上主要的互联网服务平台都由美国互联网企业经营,这些美国互联网公司掌握了大量中国企业无法掌握的全世界非开源数据。这些美国公司利用全世界数据资源进行人工智能大模型训练,其数据的多样性和质量优于中国有关企业,相比美国同行,中国本土人工智能的发展仍面临数据瓶颈。
二、化解本土人工智能发展瓶颈也需要法治创新
从根本上化解中国本土人工智能发展的算力瓶颈和数据瓶颈需要中国在芯片产业、互联网产业、社会文化产业等方面加速发展,达到世界一流水平。为此中国要努力建成世界顶尖的芯片企业、互联网平台、大学和其他社会文化机构,这些是根本之策、长久之计。而立足当下,在中国尚未完全突破美国的算力资源封锁,尚未完全建成容纳全世界优质数据资源的企业和文化机构的现实下,缓解中国本土人工智能发展的算力瓶颈和数据瓶颈需要法治创新。具体而言,法治创新的主要目的是通过更为科学完善的法律机制,大幅提升现有算力资源和数据资源的利用效率,防止在面临算力瓶颈和数据瓶颈的同时出现算力浪费和数据浪费,以期为中国本土人工智能的发展奠定基础。
第一,要加快算力资源权利化进程,通过法治创新促进算力资源共享使用,大幅提升现有算力资源的使用效率。当前,尽管我国在获得顶尖算力硬件方面遭到美国技术封锁,困难重重。但我国本土算力硬件也有一定的技术水平,同时我国也可以较为方便地获取一定算力能力的算力硬件资源。在这种情形下,提升现有算力利用效率就是缓解我国人工智能发展算力瓶颈的一个思路。为此,就要从在法律机制上将算力确权,明确算力共享的各方享有的权利义务,使得算力共享使用在中国成为常态。
第二,要加快数据权利化进程,通过法治创新促进国内数据资源共享使用,大幅提升现有数据资源的利用效率。当前,利用开源数据进行人工智能模型训练已经达到一个瓶颈,地球上便于获取的开源数据几乎都已经被纳入人工智能模型训练。在这种情况下,就要将开源数据资源以外的数据资源纳入人工智能训练,千方百计开拓训练资源库。然而,开拓训练数据库又面临个人信息保护、国家秘密保护、商业秘密保护以及知识产权问题。在这个领域,也要求进行法治创新,一方面切实保护个人信息、国家秘密、商业秘密不被泄露或滥用,另一方面能大幅提升现有数据资源的利用效率,促进人工智能技术发展。
三、通过完善算力共享法律机制化解算力瓶颈
当前,我国已经在局部建立了算力共享网络。2024年11月23日,上海市人民政府办公厅印发《上海市发展医学人工智能工作方案(2025—2027年)》,明确提出“促进多方算力互联互通,强化智能算力集群建设”。2025年1月3日,全球首个光电融合确定性新型算网基础设施在中国开通。根据记者报道:“仅需3.8毫秒,安徽宿州一家企业人工智能大模型的训练数据,便可以从宿州抵达江苏南京,再经过12毫秒,算力调度平台即可将它们送达1300多公里外的甘肃庆阳。在这个过程中,这些‘远道而来’的数据的训练效率,相当于同一个智算中心内训练数据的95%。有了南京和庆阳两处算力中心的协助,这家企业的‘算力荒’得到缓解”。[4]从目前情况看,算力共享能够有效缓解中小人工智能企业的算力瓶颈,提升现有的算力使用效率。下一步,要更大范围实现更有效率的算力共享,要在以下几个方面完善算力共享的法律机制,实现法治创新:
第一,要明确算力的权利属性,进一步完善算力财产权相关法律机制。对于稀缺资源,提升其利用效率的一个重要方法是对其予以权利化。一旦某种稀缺资源被权利化,就可以更安全和便利地出租、转让,就能有效提升该项资源的利用效率。算力作为人工智能时代的稀缺资源,也应当予以权利化。要明确算力的权利属性,要把算力资源也视为一项财产,要探索以算力这项财产为标的算力产权制度。在这方面,一些地区已经走在前列。比如,贵州省大数据发展管理局出台《贵州算力券管理办法》,将算力这项财产“证券化”,创设了“算力券”,这有利于明确算力的权利属性,便于进行算力交易。
第二,要进一步完善算力交易的法律机制。既然算力被视为一项财产,则算力可以被出租和转让,这就是算力交易。当前,我国已经设立了“东数西算”一体化算力服务平台、上海算力交易平台、天津市算力交易中心、武汉算力公共服务平台等多个算力交易所或交易平台,已经有较为丰富的算力交易实践。但当前围绕算力交易的法律机制尚不健全,比如算力交易属于算力资源买卖合同、算力服务合同或是算力资源的租赁合同?不同的法律属性往往意味着在出现争端时适用的法律条款不同、算力交易各方承担的权利义务不同,这些问题都需要法治创新予以解决。
第三,要进一步完善公共算力资源共享使用法律机制。在人工智能时代,算力资源不能仅仅被少数大企业或大型机构垄断。很多中小企业甚至公民个人,都需要拥有一定的算力资源使用机会,这有助于人工智能时代创业创新。从DeepSeek崛起事件看,突破性创新很有可能由跨行业中小企业实现。因此,要想提升中国人工智能的创新水平,就要完善公共算力资源共享使用法律机制。国家应当像看待公共图书馆、公共教育一样看待公共算力资源,要通过立法为公共算力资源共享提供法律依据,并明确规定公共算力资源有偿使用和平价供给的范围和条件,明确各方权利义务,避免在全社会出现“算力鸿沟”,同时也为全社会利用公共算力资源进行创新创业提供便利。
四、通过完善数据流动共享法律机制化解数据瓶颈
人工智能技术的发展不仅需要算力,还需要数据,尤其是高质量数据。近几年,我国已经充分认识到数据对于数字经济和人工智能发展的重要作用,围绕数据这一新生产要素的法律机制正在逐渐完善。当前,通过完善数据共享法律机制化解数据瓶颈,还要在以下几方面发力。
第一,进一步畅通数据跨境流动的法律机制。一段时间以来,我国对于数据跨境流动比较警惕,这是由于当时我国缺少全世界有影响力的数字经济企业,数据跨境流动更多表现为中国数据向海外企业数据库流动。随着中国本土数字经济企业和人工智能企业的崛起,越来越多的中国企业也需要从境外获取大量数据,或者将数据或智能算力中心设在境外,需要在境外处理中国国内相关数据。比如,一些中国企业建立将算力中心设在海外,在这种情形下海外的中国算力中心就要处理大量境内数据,对此不能将其和一般意义的中国数据向海外跨境传输同等对待。因此,我们要进一步畅通数据跨境流动的法律机制,要建立以数据的实际控制方为主的标准进行分类审查,对于数据实际控制方掌握在中国主体的数据跨境流动采取符合其特点的审查标准。再比如,随着中国数字经济企业和中国人工智能技术的发展,中国也需要从海外获取大量数据资源,我国当前数据跨境法律机制对此考虑不多,下一步也要围绕“全世界数据资源汇集地”完善数据跨境流动的法律机制。
第二,进一步提升公共数据的开放利用水平。在我国各类社会经济活动中公共部门居于主导地位,因此我国政府或公立机构掌握了海量的优质公共数据,这些公共数据开放利用水平还有待提升。比如,我国各类专业期刊和报纸大多均为财政支持的公立机构主管主办,这些资源严格意义上都属于公共数据范畴,应当在满足一定条件的基础上向全社会开放,而不应成为少数企业获取高额利润的“独家资源”。
第三,完善数据共享的激励机制。当前,海量数据掌握在数字经济企业手中,因此大型数字经济企业在发展人工智能技术方面拥有天然优势。但我们也要注意到,DeepSeek就不是传统大型数字经济企业发起的人工智能企业,这也是DeepSeek获得人工智能研发技术突破性进展的重要因素。因此,促进本土人工智能技术的可持续发展,也要防止数字经济企业的数据垄断,要通过法治创新促使数字经济企业将其数据依法共享给人工智能专门技术企业。同时,还有海量数据掌握在其他各类企业手中,这些企业单凭一己之力无力进行人工智能技术研发,但也应当鼓励其加入数据共享机制。为此,就要完善数据共享的激励机制。当前,一些地方已经开展“数据换算力”的实践。下一步,要在依法促进数据共享的激励机制方面下功夫,尤其是促进数字经济企业与人工智能技术企业进行数据共享、促进传统企业相关数据资源的电子化和共享化。
总之,尽管DeepSeek的崛起意令人振奋,但我们也要清醒地看到中国本土人工智能技术发展仍面临算力瓶颈和数据瓶颈。为此,根本之道是促进本土芯片产业等发展,但围绕算力资源和数据资源进行法治创新,通过法治创新提升现有算力资源和数据资源的使用效率,促进中国本土人工智能持续发展。
↓↓了解更多资讯,请识别下方二维码↓↓
国脉集团是数据资产化专业服务机构,为数据资源拥有者提供专业、规范、合规的全流程数据资产化服务,包括培训、咨询和产品设计等,实现数据资源价值最大化。主要服务于政府数据管理机构、央国企数据运营企业、城市数据运营平台和数据富集型平台企业,打造数据资产网、数据资产研究院和产业专家网络等支撑体系,同时在营商环境与政务领域继续保持领先优势。 主要课程包括数据资产入表、数据经纪人、公共数据运营和政府CDO、数据精品等精品课程。 数据资产化服务:数据资产化战略布局、数据资产入表、数据产品开发及交易等关键任务; 数据要素×项目服务:政策扶持、案例奖项申报、金融支撑和市场变现; 数据产业园区和试验区咨询服务:园区规划、咨询、资源导入