理论专题·先声|AI如何“向善”进化?我们向专家问了三个问题

理论周刊 |  2025-03-18 09:23:01 原创

崔凯铭  张浩来源:大众新闻·大众日报

微信扫码扫码下载客户端

DeepSeek席卷全网之后,Manus再度霸屏。2025年初,关于人工智能的讨论持续火热。

近年来,人工智能技术飞速发展,极大地影响着人们的日常生活。人们既享受着便利,也面临着挑战。

随着人工智能应用场景日益广泛,数据安全、算法伦理、算力能耗等问题也愈发不容忽视。

大众日报理论版推出专题策划,聚焦人工智能发展进程,多视角探究技术发展中的现实挑战,为构建科技向善的良好生态提供专业思考,敬请关注。

问题一:我的个人资料,AI的免费“养料”?

大模型数据“投喂”的法律边界

□ 袁嘉

(四川大学法学院创新与竞争法研究中心主任,副教授,博士生导师)

人工智能大模型的发展依赖海量数据的“投喂”,这一过程既是技术迭代的必然需求,也引发了版权侵权、数据安全、隐私保护等法律争议。如何在保护知识产权、保障数据和隐私安全与促进技术进步之间寻求平衡,成为制约国产人工智能大模型发展的核心难题。

大模型数据使用的法律争议

人工智能大模型的训练需基于海量文本、代码及图像数据,借助机器学习算法提炼知识规律。国产人工智能大模型一直面临激烈的国际竞争,在美国OpenAI公司的GPT系列大模型爆火之后,国内的通义千问、文心一言、豆包和Kimi等大模型纷纷开启了追赶的步伐,今年年初的DeepSeek更是以其优良的性能和超低成本震惊全球AI产业界,并得到了行业和终端用户的认可和喜爱。然而,上述大模型的快速发展也面临着较大的法律风险,未经授权的数据抓取与复制,常被谴责为“数据盗窃”或“非法牟利”行为。例如,某国产大模型因使用未获授权的文学作品训练,被原著作者起诉索赔,引发行业对数据来源合法性的广泛讨论。与此同时,数据安全风险亦不容忽视:训练数据可能包含敏感信息(如商业秘密、个人隐私),若未经过脱敏处理直接使用,可能违反《数据安全法》《个人信息保护法》和《反不正当竞争法》。这种矛盾凸显了技术快速发展与法律规制滞后之间的紧张关系。

针对大模型数据使用的法律争议,学界提出以“公共领域”理论重构规制框架。黄汇等学者的研究表明,大模型数据使用行为可划分为输入端(即训练阶段)和输出端(即生成阶段)两大层面,需针对性地实施差异化规制措施。在训练阶段,大模型训练的核心在于学习“非作者价值”的元知识,如语言规律和逻辑结构,而非直接复制具体作品的独创性内容。这种使用未对原作品市场价值造成可感知的损害行为,应被纳入公共领域范畴。例如,统计语言模型对文学作品的碎片化学习,本质是对公共知识资源的再利用。而在生成阶段,若大模型生成内容与训练作品构成实质性相似,则可能挤压原作者的创作空间,需通过《著作权法》予以规制。此时需区分“合理借鉴”与“搭便车”行为,避免逆向激励效应。

技术角度解决侵权风险的可能性

从技术角度出发,大模型的打磨和优化必须依赖高质量和大规模的数据使用。当前大模型训练面临“数据幻觉”与“灾难性遗忘”等问题:低质量数据可能导致模型输出失真(如错误推荐、工业误判),甚至放大社会偏见。为了提高数据的质量,大模型训练往往需要使用更多可能具有创新成果属性的受保护数据,这一根本矛盾如果无法解决,也将导致侵权风险。当然,技术层面的革新可以为解决数据需求与效率平衡问题提供新的途径:例如,GPT-4.5等模型通过“强度平衡算法”和“硬件优化对齐”,在减少计算成本的同时保持性能。Claude 3.7 Sonnet通过其先进的编程能力,允许开发者动态调节推理资源分配,实现“用更少的数据思考得更智慧”。这种技术突破显著降低了数据规模的门槛,为小规模数据集的高效利用提供了可能。而建立数据清洗、验证与溯源体系也对从技术上降低侵权风险至关重要。一般情况下,数据质量的下降是导致大模型误答率上升的主要原因。企业可通过区块链技术记录数据来源,结合AI审核工具自动筛查敏感信息,提升数据质量,实现合规与效率的双重目标。只要数据质量显著提升,对于侵权数据的使用需求就能降低,这是从技术角度解决侵权风险问题的基本原理。

构建“立法—技术—行业”协同的治理体系

首先,从立法层面,可以细化合理使用条款。在《著作权法》中,增设人工智能大模型训练作为合理使用情形之一,既符合原有合理使用制度的定位,又能兼顾权利人的利益。同时,《人工智能法(学者建议稿)》提出的“大模型训练合理使用制度”也具有现实意义,但需进一步明确适用条件。

其次,从技术层面,应当推动数据匿名化与合成数据。利用生成对抗网络(GANs)生成合成数据,既能保留数据特征,又可规避版权风险。DeepSeek等企业已尝试通过算法优化减少对真实数据的依赖。这样一来,也大大降低了数据使用的侵权风险。

最后,从行业层面,应当建立数据共享生态。推动政府、企业、学术机构共建开放数据集(如国家语料库),并提出人工智能训练数据透明度的要求,通过标准化协议实现合规共享。例如,欧盟《人工智能法案》要求大模型开发者披露使用受版权保护的材料来训练人工智能,并鼓励公共数据开放,以提高透明度和确保人工智能系统的安全性。

人工智能大模型数据使用的法律边界并非非黑即白,需在公共领域理论指导下,结合技术优化与制度创新实现动态平衡。未来,那些能在数据质量、使用效率与合规性之间找到最优解的企业,将主导人工智能的下一个竞争周期。这要求法律回应技术变革的敏捷性,同时为创新保留必要的容错空间。正如每一次技术革命都会引发巨大的社会变革,人工智能时代的数据治理亦需在保护与解放之间开辟新路径。

问题二:不断升级的算法,不可预知的风险?

尊重科技规律 规范算法风险

□ 林洹民

【中央财经大学副教授、工业与信息化法治研究院(工信部重点实验室)研究员】

随着ChatGPT、DeepSeek等通用人工智能的高速发展与广泛应用,人工智能技术已成为新质生产力的重要引擎,逐步渗透进现代社会的方方面面。算法、数据、算力是人工智能发展三要素。人工智能时代的社会治理,离不开对算法的全方位规范。算法本质是一套计算机技术,对算法活动的法律调整,是对科技活动的社会调控,必须充分重视科技系统自身的规律。此外,人工智能算法投入市场,也会对公众产生影响,需要通过“权利-义务-责任”机制调整算法的外在应用。

人工智能属于新一代科技革命中的表征性科技。人工智能研究属于一项专精科技活动,旨在开发出可以自我分析、自我总结、自我纠错的人工智能系统。在大语言模型的加持下,有些科研活动直接瞄准超级人工智能,力图使得人工智能呈现出一种人类尚未发现或无法实现的逻辑形式,进而超越人类智能,探索到人类无法触及的高度。

人工智能研发本质是一项科学研究,相应地,对人工智能算法的规范也应在尊重科技系统自身规律的前提下进行。规范科研活动,应优先借助科技系统自身。对人工智能算法的规范,应通过设计研发伴生性规范的方式,将科研伦理内化于科研过程。我国未来的人工智能法应关注研发过程,强化对科学家遵守科技伦理的要求,规定记录义务、报告义务、安全管理和伦理委员会等制度。

在众多科技伦理制度中,记录与报告义务是科技伦理的基石。记录是科技系统自我观察与调试的基础。人工智能活动引发的风险具有不可预测性,唯有借助科学记录,才能在一定程度上理解正在进行的科研活动。记录义务并非仅存在于实验室,而应贯穿人工智能系统全生命周期。欧盟《人工智能法案》第12条第1款明确要求高风险人工智能系统应具备在运行时自动记录事件的能力,第2款则强调人工智能开发者将人工智能产品投入市场后需要承担产品追踪记录义务。报告义务与记录义务相辅相成,是同一枚硬币的两面。当强人工智能有望实现时,科研工作者更应及时报告,因为强人工智能技术可能是人类最后一个发明,会给作为发明者的人类带来巨大危险。当然,也有人认为人工智能末世论过于夸大人工智能的危险。对此,或许只有时间才能分辨对错,但当奇点时刻来临时,不应仅由科学家决定人类的命运,要让研发者之外的其他人也获得决定权,就必须使其能够实时了解研发进度。

当聚焦人工智能活动时,人们更多关注的是人工智能赋能应用场景。人工智能是一项通用技术,是科学研究、教育、制造、物流、运输、司法、行政、广告、艺术等众多领域与人类生活各方面的赋能者。通过在具体应用场景中的调整,人工智能可以满足多样的需求。以近期备受关注的人形机器人为例,人形机器人就是人工智能技术与场景的叠加和结合的典型,其根据不同场景需求呈现出不同的表现形式,如陪伴机器人、看护机器人以及亲密机器人等。我国工业和信息化部《人形机器人创新发展指导意见》指出,应首先研发出基础版人形机器人整机,打造“公版”通用平台,然后支持不同场景需求下的结构改造、算法优化以及特定能力强化。

相应地,社会公众对算法监管的关注,也主要集中在对人工智能具体应用场景的关注。人工智能在各个领域中的应用不可避免地对个人产生影响,引发算法歧视、隐私侵犯等问题,如大数据“杀熟”、个性化推荐制造“信息茧房”、AI客服骚扰来电、AI假新闻等。这些无孔不入的算法乱象,不仅影响了公众的生活,也削弱着公众对算法技术的信任。法律作为社会回应新型挑战的有力工具,有必要对此进行更为积极的干预,抑制“算法作恶”,引导“技术向善”。法律需要通过权利-义务-责任机制,规范人工智能算法的外在应用。

以权利为例,为了捍卫人的中心地位,用户应享有一系列保护性权利,如知情权、算法解释权等。举例说来,眼下,人工智能生成合成内容日益逼真,用户有权了解新闻、视频是否由人工智能生成。近日,国家网信办等四部门印发《人工智能生成合成内容标识办法》,旨在促进人工智能健康发展,规范人工智能生成合成内容标识,保护公民、法人和其他组织合法权益,特别需要注意的是,我国未来的人工智能立法应专门规定请求人工沟通的权利,因为只有保证个人享有表达意见、获得人为干涉的权利,人才不会沦为机器的客体。欧盟《通用数据保护条例》第22条第3款专门规定了用户请求人工干预的权利。相较而言,我国《个人信息保护法》第24条第3款仅规定请求说明算法和拒绝算法决定的权利,并未规定人工沟通的权利。受影响的个人有权与机器背后的人进行有意义的沟通,是捍卫人的主体地位的基本要求。人工智能时代的立法,应更加重视人的主体地位,以人为核心,让科技进步服务于人类福祉。

总之,在人工智能时代,对人工智能算法的法律规制是必要的。同时,政府也应保持谨慎,避免盲目出台政策,阻碍人工智能产业发展。当前,我国监管部门正尝试通过算法备案的方式强化对人工智能活动的监管,应警惕备案成为变相审批,干扰科技研发,过度侵蚀科技系统自主性。对人工智能算法设计的监管,应强化人工智能开发者的持续记录与报告义务,借助科学系统自身的控制阀门实现治理目标。如果未经论证就采取管控措施,可能会阻碍我国人工智能的发展。

问题三:越强的算力,越高的能耗污染?

以系统思维推动“算碳解耦”

□ 陈强 赵子文

(同济大学经济与管理学院)

高性能算力是推动人工智能等前沿技术进化的核心驱动力。当前,科技领先国家纷纷加大对算力基础设施的投资,全球计算设备算力规模连续两年增速接近50%。但是,算力背后的高能耗问题也不容轻视,数据显示,全球数据中心的能耗水平已经超过整个英国。算力越强,碳排放越高,两者之间呈现出显著的耦合关系。如何在保障算力增长的同时尽可能减少碳排放,实现两者之间的“解耦”,成为亟待解决的难题。

习近平总书记指出,“实现‘双碳’目标是一场广泛而深刻的变革,不是轻轻松松就能实现的。我们要提高战略思维能力,把系统观念贯穿‘双碳’工作全过程”。同样,推动算碳解耦更要以全局观念,统筹技术与产业、地区和部门、政府与市场等多重关系,综合施策。

推动技术与产业协调发展,找准技术突破口

算碳解耦应该从厘清算力技术的底层逻辑出发,层层分解优化每个技术环节的碳排放,打造绿色高效的算力体系。算力作为动态发展的前沿技术,其性能与硬件设备、部署方式、运行调度等各环节密切相关。通过研发新架构和制程、加快专用计算芯片量产,可以大幅度提升硬件设备的计算效率;借助科学选址和浸润式冷却节能技术,可以从部署端降低数据中心能耗;依托人工智能技术,可以实现更加精准的能源需求预测和算力调度。

算力的价值实现,在很大程度上取决于算力资源与产业需求的匹配度,只有通过低成本的高性能算力赋能产业发展,并在产业发展中推进算力绿色化,才能够促进技术与产业融合发展。一方面要通过搭建算力交易平台,实现算力供需两侧的精准对接,降低中小企业获取高性能算力的门槛;另一方面要推动算力产业与工业、能源、交通等领域的互动式发展,不断拓展应用场景,增强算力产业的赋能效应。

统筹地区和部门一盘棋,达成时空协调

我国幅员辽阔,各地资源禀赋和发展水平存在较大差异,算力需求和清洁能源供给之间处于不平衡状态。在此背景下,“东数西算”工程从空间维度上提供了算碳解耦的可行解。东部地区聚焦算力应用开发和市场服务,西部地区则专注绿色数据中心建设和清洁能源开发。“东数西算”打通了算力和碳排放的时空走廊。一方面,缓解了东部地区高强度算力需求带来的能源压力;另一方面,将高能耗数据中心转移到清洁能源富集的西部地区后,不仅降低了碳排放水平,还带动了西部“算力经济”发展。“东数西算”工程启动以来,已拉动投资超过2000亿元,孵化了国内最大的自动驾驶智算中心“扶摇”,以及全国首个100%可溯源数据中心——青海绿色大数据中心。

同时,算力产业涉及工业、能源、通信等多个领域,需要各部门之间的密切协同。工信、科技部门应加快组织绿色算力技术研发攻关,推动算力向高效低碳转型;能源部门应加快清洁能源并网,提升绿色电力占比;通信部门应进一步优化网络基础设施布局,为算力高效调度提供支撑。此外,各部门要根据不同行业、地区的具体情况,因地制宜,保证政策在时间维度上的连贯性和持续性,避免政策冲突和资源错配。通过部门联动和政策协同,将部门“分力”汇聚成系统“合力”。

深化政策与市场互动,构建长效机制

在推动算碳解耦的过程中,一方面要发挥政策的引导作用,强化算碳解耦的顶层设计。通过构建并完善绿色算力的标准体系,明确数据中心在综合能效、设备功耗、冷却方式等方面的技术要求,为企业建设绿色算力提供行动指引。并针对不同能效水平的数据中心实施分级管理,制定差异化政策,推动落后闲置算力退出市场。

同时,通过加大财政支持力度,综合运用税收减免、“算力券”等治理工具,鼓励企业加快绿色算力技术研发和应用。另一方面,充分发挥市场在算力资源配置中的决定性作用,通过建立算力碳排放交易体系,将算力碳排放成本显性化,鼓励金融资本进入绿色算力赛道;激发企业内生动力,主动开发低碳高效的计算方案,实现经济效益与社会效益的双赢。

以系统思维引领,推动算碳解耦,可以为全球数字经济发展和绿色转型提供中国经验和智慧。

相关链接:

理论周刊专题|Sora横空出世,透视人工智能的三大基石

责任编辑:崔凯铭 张浩