在2025年全国知识产权宣传周到来之际,《数字法治》期刊紧扣主题——“知识产权与人工智能”,在最高人民法院民事审判第叁庭、知识产权法庭的支持与指导下,聚焦数字时代的知识产权理论研究最新成果和实践发展最新动态,推出一组具有前瞻性、原创性、实践性的学术文章,希冀服务新质生产力发展。我院副院长熊琦教授指导其硕士研究生陈子懿完成的学术成果入选本组文章,文章将在《数字法治》2025年第2期刊发。

熊琦
天美麻花果冻糖心副院长、教授

陈子懿
华中科技大学知识产权司法保护理论研究基地助理研究员
【刊发】《数字法治》2025年第2期
【摘要】生成式人工智能所引发的着作权争议,本质上是数字化时代技术革新所带来的持续性挑战。对此各国普遍在坚守人类创作者主体地位与独创性认定标准的同时,在不同程度上通过调整合理使用制度为技术创新预留空间。但各国和地区基于制度传统和产业基础在具体调整方式上作出了不同的选择。美国延续创新激励的判例法传统,为产业充分博弈与合作留足空间;欧盟则延续着作权人保护优先的策略,以立法强化对技术的监管;日本则在全面促进技术创新的导向下,利用着作权法中特殊的分层规制模式将机器学习纳入合理使用。这些立法选择体现了不同法域的立法传统与产业发展策略的不同。我国在人工智能领域处于从技术追赶向局部领跑转型的关键阶段,一方面不应过度放宽可版权性标准,另一方面则应借助合理使用制度帮助认定机器学习大规模使用的合法性,以此保障人工智能产业发展。
【关键词】人工智能 著作权 合理使用 可版权性 全球立场
一、导论
生成式人工智能所体现出的聚合特征,使其越来越广泛地通过应用软件全面运用于基础性日常工作和专业性复杂任务,亦为着作权制度带来新挑战。概言之,生成式人工智能的着作权争议主要集中在两方面:一是生成物的可版权性认定;二是机器学习使用作品的合法性认定。两大核心议题并非人工智能语境下的全新命题,而是技术迭代对传统版权范式冲击的延续性表现。从历史维度来看,生成物独创性争议可追溯至摄影机、计算机软件介入作品创作的历史,而机器学习对海量作品的使用则延续了计算机逆向工程、搜索引擎等技术开发的合法性讨论。有鉴于此,当前全球规制路径呈现出既有共识也有分歧的状况。在可版权性认定问题上,各国皆未采取新立法来为人工智能创设特例,而是在现行法律框架内维持既有独创性判定标准,且在使用者创作贡献等关键问题上已逐渐形成共识;在机器学习训练数据的合法性认定问题上,各国基于不同的立法传统与政策选择了宽严不一的权利限制方案,使得司法上因缺乏共识而陷入“扩张合理使用”与“优先补偿着作权人”的价值困境,既折射出传统版权体系应对技术革命时的路径依赖,也凸显出数字化生产范式与既有权利架构的深层张力。
目前,我国在可版权性认定上同样采取以既有规范应对的路径,在机器学习合法性认定上则通过《生成式人工智能服务管理暂行办法》等政策性文件提出原则性要求。由于国内的人工智能产业生态以用户端应用为主导,相关争议更多集中于人工智能服务提供商的责任认定,只有少数案件的裁判从促进技术创新角度提出机器学习构成合理使用。而在可版权性认定上,已有的案例中创新性地将仅通过反复输入提示词生成内容的用户视为作者。鉴于目前我国对生成式人工智能着作权规制的实践情况,有必要梳理各国着作权规制范式的形成动因,结合本土实践探索出一条具有动态适应性与内在统一性的生成式人工智能治理路径。
二、生成式人工智能版权规制模式的全球立场
当前全球对于人工智能生成内容的可版权性问题已形成初步共识,各国均倾向于通过法律解释来延续传统着作权制度框架,避免颠覆式的立法创设。而对机器学习所引发的技术创新与权利保护冲突,各国则采取了不同的应对路径。
(一)可版权性认定的立场共识生成
自生成式人工智能开始介入创作和传播,全球人工智能技术处于领先地位的国家存在的普遍共识就是完全由人工智能输出的内容不具有可版权性。着作权制度的规范结构始终建立在人类主体性的预设上,技术创新带来的创作工具革新无法撼动“人类中心主义”的法理基础。因此,各国始终秉持自然人创作激励的着作权目标,无意为人工智能提供额外的版权保护。即便是此前为计算机生成作品提供具体保护的《英国1988年版权、设计和专利法》第9条第3项,也未将计算机视为作品的作者。坚持人类作为创作主体的核心地位,既是法律伦理的必然选择,也是现实技术条件的客观限制。若将人工智能上升为法律主体,需基于压倒性的政策必要性,此种必要性需超越以人为本的社会共识,甚至重构现有伦理框架。但国际社会普遍认为,此种必要性并不存在。赋予人工智能主体资格不仅缺乏正当性基础,还可能引发制度危机。当海量低成本的生成内容涌入日常,权利归属的模糊与保护标准的失控将破坏着作权制度通过有限垄断激励人类创新的核心功能。更何况当前人工智能本质上是工具,其生成内容依赖于人类预设的数据模型与算法逻辑,既无法独立构思创作,更不具备脱离人类干预的自主意识。技术工具性与人类主导性的双重现实,共同促使维持人类创作主体地位的全球共识形成。
但将机器作为创作工具,并不当然地排斥人工智能生成内容受到着作权法保护。在生成内容的独创性认定中,审查焦点始终为提示词设计、参数调整等人类的智力投入,而非生成内容的客观表达形态。随着对生成式人工智能技术的认知深化,曾经备受争议的人类创作与机器创作的区分问题也已形成阶段性的共识。2025年1月美国版权局发布的《版权与人工智能》报告第二部分,就全面整合了之前各界围绕人工智能生成内容可版权性认定上的讨论,逐一回应了人类可能利用人工智能进行创作的不同类型:提示词、纳入人类创作的输入与对输出成果的安排和修改。
首先,针对提示词输入,该报告明确提出输入简单的提示不足以使用户成为作者。对于复杂提示是否构成创作的问题则争议较大,争议双方对提示复杂度是否影响用户对作品的控制力存在相反意见。对此,美国版权局类比了共同作者身份来说明获得着作权法保护所需的控制程度。在雇用他人进行创作时,只有当受托者完全处于机械复述或转录的状态,委托方才能够主张作者身份。然而,人工智能生成内容的技术原理,显然并非生搬硬套或机械化复制,也并非忠实地将用户的想法转化为可预期、可控制的表达方式,而是很大程度上由人工智能的算法系统决定了输出结果中的表达元素。即使输入者反复修改并付出相当的时间精力,但若未对表达元素形成实质性控制,则终究是劳动而非智力创作,不应受到着作权法的保护。所以无论提示词被修改和重新提交多少次,最终输出仍然反映的是使用者对人工智能系统解释结果的接受,而不是对自身表达的控制。因此,该报告明确作者身份认定的关键在于对表达元素的控制力,而不是对提示词的调整和投入的劳动等其他要素,提示词输入的次数和选择行为都不能被视为独创性来源。同时,报告也强调技术发展存在人类控制增强与自动化程度加深两种可能,可版权性认定的结论必然随着技术发展而进行动态调整,当前论断仅建立在对现有技术评估的基础上。
其次,自然人对人工智能生成内容的后续修改、编排,可以受到著作权法的保护,但保护范围不会延伸至人工智能生成的内容本身。该报告的这一结论延续了此前美国版权局对《黎明的扎莉亚》(Zarya of the Dawn)可版权性审查的经验。该审查结论认定,对文本图像的选择、协调和安排可以作为汇编作品受到保护,但其中单个人工智能生成的图像则不具有可版权性。基于这一立场,美国版权局已作出接受《一块美国奶酪》(A Single Piece of American Cheese)版权登记的决定。创作者对人工智能生成的多个图像进行选择和安排,使其呈现出统一构图的行为,被认为符合汇编作品的保护要件。事实上,该作品的修改次数远低于被美国版权局多次驳回的人工智能生成图像《太空歌剧院》(Thé?tre D'opéra Spatial),但由于创作者选择了对图像加以二次创作而非单纯优化提示词的操作路径,使得其最终形成的作品承载了人类的智力贡献而具备了可版权性。
美国版权局报告中对于可版权性的意见既基于长期广泛的产业调研,也源于其受理的多起人工智能生成内容版权登记审查实践。此前为应对大量人工智能生成内容的登记申请,美国版权局在2023年专门发布了《版权登记指南:含人工智能生成材料的作品》,要求考察人类在多大程度上对作品的独创性表达作出了智力贡献。而且自第一起人工智能生成内容的可版权性争议开始,美国就始终秉持个案判断的思路,并排除了人工智能技术类型和所生成内容的艺术性高低等因素的影响。这与日本对人类创造性参与程度的强调高度契合。日本2024年3月发布的《对于人工智能与着作权的意见》同样对人工智能辅助使用和表达输入作出了认定。对于提示词与生成内容可版权性之间的关联性,日本同样遵循与既有着作权法中作者身份判定相同的逻辑,要求用户所输入的提示词不能过于笼统。如果用户能够通过具体提示词明确引导出可被视为独创性表达的部分,就更有可能具备可版权性。此种审查思路与美国对表达控制力的要求相同,核心都在于人类对创作过程的有效掌控能否被反映在最终的独创性表达之中。尽管美国、日本所定义的“提示”在范围上存在差异,但二者均明确否定了提示次数、选择行为本身对可版权性认定的影响。同时,人类创作的部分也始终独立于人工智能生成的内容本身,版权认定相互不受影响。由此可见,着作权法保护的对象始终是源自人类的创造力。自生成式人工智能介入创作和传播至今,各国就上述问题已经基本形成了共识。
在此共识的基础上,各国和地区在是否有必要为人工智能著作权进行专门立法的问题上也作出了相同选择。美国一直认为既无须为单纯的人工智能生成内容提供激励,也无须为人工智能技术的国际竞争而去突破宪法和著作权法的约束。欧盟成员国也一致认为没有创设特殊权利的必要性,其《人工智能法案》针对的乃是技术监管而非著作权问题。与此同时,英国自2024年开始在其新一轮“人工智能和版权咨询”(Copyright and Al: Consultation)中,就是否有必要修改《1988年版权、设计和专利法》第9条第3项“为计算机生成作品提供保护”的内容进行了讨论,并得出应该在立法上取消对计算机生成作品提供特殊保护的意见。该条款此前遭遇的批评,主要集中在条款内部存在矛盾进而导致解释的不确定性。现代著作权法对独创性的要求,是作品必须来自“作者自己的智力创作”并反映“作者自己的个人风格”。然而,该法第9条第3项仅适用于“没有人类作者”的作品,这一矛盾导致该条款在实践中能否适用存在争议,如何定义完全由机器创作的“原创”作品尚不明确。
对此,英国政府预设了叁种政策方案,并根据明确性、激励性、平衡性叁项目标作出取舍。具体选择如下:其一,维持现有法律的保守方案。英国政府认为,这可能延续计算机生成作品保护范围的不确定性弊端,也无法应对当下人工智能生成内容的冲击,因此主张摒弃该方案。其二,明确界定计算机生成作品保护范围的方案。英国政府认为,如果有证据表明人工智能生成内容的着作权保护具有经济效益,并且能够激励对人工智能产业的开发和投资,就有必要对该条款加以重塑和澄清。其叁,取消对计算机生成作品的特殊保护。在此方案下,英国政府认为,完全由人工智能自主生成的内容不应得到特殊保护。国际上大多数人工智能技术领先型国家都没有专门规定此类作品的特殊保护条款,因此,专设计算机生成作品条款没有必要,本方案也是上述叁类方案中英国政府倾向于选择的。尽管英国政府仍将根据公众意见来评估这一选择的可行性,但是其倾向性与美日欧等国家和地区的政策选择相吻合,也再次体现出既有着作权法的可版权性标准足以应对人工智能生成内容已基本形成全球共识。
(二)机器学习使用作品的合法性立场争议
任何基于机器学习的系统,无论其目标和产出如何,都需要大量数据进行训练。因此,生成式人工智能模型需要借助人类已有的作品来进行训练,包括图书、绘画、软件在内的所有作品类型都是机器学习的对象。这些作品被转化成标准格式的数字编码文件,而后被整合汇编为庞大且结构严谨的训练数据集。尽管数据收集阶段所涉的着作权权项不尽相同,但进入模型训练阶段,人工智能开发者均需将所获取的数据集组装入机器学习模型中,由此落入复制权的范畴,机器学习使用作品的合法性争议由此产生。
从域外司法诉讼看,著作权人主要针对OpenAI、Stability AI等头部人工智能公司提起诉讼,且多为由作者或艺术家发起的集体诉讼。大部分案件仍在审理阶段,少数已裁决的数据训练案件无法为生成式人工智能场景下的使用行为提供有力指导。2024年9月,德国地方法院作出欧洲首个转化适用文本数据挖掘例外条款的判决,驳回了原告摄影师指控LAION数据集未经授权使用其照片的侵权主张。该判决的参考价值主要体现在三方面:一是明确《德国著作权法》第44a“临时复制”条款不适用于直接从网络上下载并存储图片的行为;二是将人工智能划分为数据集创建、模型训练、内容生成三个阶段进行分析,区分界定不同环节参与者的责任;三是扩张解释“科研目的”,将“商业目的”的认定置于研究活动范畴内,不再直接排除商业公司研究活动的合法性。但是,该案针对的是上游主体的侵权行为,未触及生成式人工智能训练是否属于合理使用这一核心争议,因此,对于解决当前人工智能公司面临的主要侵权纠纷,借鉴和参考作用仍然有限。此外,美国汤森路透社诉Ross Intelligence一案中,法院作出了阶段性的裁定,认为创建简短的法律摘要来训练人工智能不仅侵犯了汤森路透社的著作权,而且不属于合理使用。这意味着美国部分法院试图扭转此前倾向于认定合理使用的态度。然而,该案中Ross最终输出的是法律研究搜索引擎工具,而非生成式人工智能模型,也因此种技术使用的特定用途,使得该案的认定结论无法类推适用于其他生成式人工智能的纠纷中。
与域外相比,我国针对机器学习合法性认定的案件较少。在涉生成式人工智能平台侵权的案件中,杭州互联网法院曾主张对机器学习行为采取适度宽容的司法立场,认为其技术过程不以复制作品独创性表达为目的且不涉及作品传播,可纳入合理使用范畴。然而,由于该案焦点集中于平台责任划分,法院未对机器学习合法性进行深度论证,且案件事实限定于用户个人微调模型的行为,难以为普遍的商业性生成式人工智能开发提供参考。综上可见,针对机器学习使用作品的合法性问题,全球范围内尚未形成具有普遍指导意义的典型案例。
日本与我国类似,在着作权例外规则中采取列举式立法体例,早已通过柔性立法将权利例外延伸至商业性人工智能大模型训练,被认为是最有利于人工智能开发的法域;而欧盟则建立起严格的监管体系,意图通过《数字化单一市场版权指令》与《人工智能法案》相配合来解决问题。除此之外,部分国家尚处于立法意见征求阶段。除讨论计算机生成作品特殊保护的修法必要性之外,英国政府主要围绕人工智能模型训练的版权问题开展公众咨询。早在2021年,英国便试图采取有利于人工智能产业的政策,构建最宽松的文本数据挖掘例外体系。然而,改革因遭遇诸多批评而并未成功推进。随着生成式人工智能的广泛应用,在新一轮改革中,英国明确表示司法审判无法及时地提供当前人工智能与创意产业所需的确定性,有必要通过立法进行直接的干预。对此,英国考虑过两种选择:一为强化着作权保护,要求所有情况下都需获得明确许可,但该方案可能造成英国与其他无此类限制的国家相比缺乏竞争力,极大限制技术创新、用户选择及其他人工智能技术可能带来的更广泛利益;二为引入广泛的数据挖掘例外,彻底改变着作权限制的框架,但该方案可能限制创意与媒体行业的发展,无法获知对版权产业所产生的负面效应。因此,上述方案均被英国政府放弃,转而寻求一种更为平衡的方案,即建立一个允许权利人保留权利的文本与数据挖掘例外,并辅以提升训练透明度的措施。从英国的咨询报告中可以看出,其有意保持与欧盟立法的一致性,同时认识到了欧盟立法的不完备之处,特别是其中权利保留标准的模糊性,所以试图通过“一揽子”措施来为创意产业和人工智能产业的长期发展提供稳定的法律预期。除英国之外,2023年加拿大政府也就生成式人工智能的版权问题开展了咨询,以便决定是否有必要修订其版权法以确立文本数据挖掘行为的合法性。但同样因为在意见征求过程中各方分歧较大,政府无法推进立法。
基于当前不同法域立法选择与法律解释的不一致现状,世界经济合作与发展组织(翱贰颁顿)于2025年2月发布了《基于抓取数据训练的人工智能知识产权问题》报告,提出了应对机器学习挑战的政策方法,包括数据抓取行为准则、标准化技术工具、标准化合同条款及提高利益相关者对数据爬取问题的认识等。报告认为,此种自愿性、灵活的措施可以帮助各国应对当下的挑战,同时适应不同司法管辖区的政策差异。上述建议也延续了翱贰颁顿于2024年修订的《人工智能委员会建议书》中所明确的人工智能治理原则。该建议书提倡政府构建一个灵活的政策环境,支持可信赖的人工智能系统从研发阶段过渡到部署运营阶段。同时,建议采取基于结果的方法,为实现治理目标提供灵活性,并酌情开展跨区域合作。翱贰颁顿的报告为破解机器学习合法性认定的困境提供了另一思路,软法治理在技术迭代迅速、立法周期较长的背景下更具可操作性,但同时其有效实施仍有赖于各国政府、技术开发者及权利人等利益相关者的持续对话。
叁、生成式人工智能着作权规制的政策路径依赖
虽然生成式人工智能的着作权规制已然成为实现新一轮科技创新的全球性问题,但由于各国和地区受此前政策惯性的影响,该问题的应对方案呈现出显着的地域性特征。美国通过个案裁判延续其创新激励导向,欧盟则基于自然权利观坚持强化对作者的强保护,而日本以技术中立原则构建起弹性化的着作权例外制度体系,叁种路径折射出不同国家和地区产业立场对生成式人工智能着作权治理模式产生的不同影响。
(一)美国:延续创新激励的个案认定
互联网时代的技术创新大多起源于美国,这使美国在处理与新技术相关的着作权问题上始终走在前列。通过以抽象“四要素”为特色的合理使用制度,美国相当于在着作权限制的认定上赋予了法官极大的自由裁量权,使其能够在不改变着作权法体系的前提下根据不断变化的情况适用合理使用。
开放式的制度框架,在历史上为司法裁量保留了充分的动态解释空间,使法官能够在此框架下基于技术发展需求对四个认定要素进行权重分配,形成个案导向的弹性标准,亦为在法律解释中纳入政策变量提供了通道,基于不同技术条件和适用领域来构建“要素分析—价值衡量”的审查框架。在合理使用被纳入美国版权法后,丰富的司法判例帮助引入了多元化的政策考量。生产性使用,如评论、批评等基于原作表达进行的二次创作,承载着后续创作者与公众的言论与表达自由权益;科研教育类使用着眼于知识传播效能,通过保障学术自由促进资源的公共转化;消耗性私人使用则体现了对用户隐私权与自主决策权的尊重。然而,技术使用的不可预测性决定了其法律评价需要不断回应差异化的政策目标。历史上反向工程对技术壁垒的突破,承载着激励技术竞争的公共价值;搜索引擎对作品的自动化抓取与索引,则服务于信息民主化的需求,实现知识资源的可达性。有鉴于此,司法机关通常采取谦抑的立场,在技术使用未形成成熟授权机制的情况下选择延缓介入,从而为技术发展预留空间。在有关渐进式创新的判例中,法院往往在感知到技术所能增助的公共利益时,降低对商业性要素的考量,并放宽对使用数量要素的认定标准,以保障整体复制但未输出或少量输出作品的技术能够被纳入合理使用。
概言之,美国作为判例法国家,对新兴技术一直采取“先创新,后监管”的应对路径,这同样体现于司法和立法之上。
在司法裁判中,历史上的典型判例都支持了新技术带来的传播形态,在新的着作权市场上为新技术和新商业模式开辟发展空间。早在20世纪80年代对于录像设备使用的索尼案中,法院就将技术对公众利益的影响纳入考量范围,没有采取严保护的立场,使录像机凭借其复制功能迅速普及。电影制片厂则巧妙利用了这一优势,通过录像带租赁业务开辟新市场,形成了版权保护与技术革新的良性循环。随后在90年代针对戏仿和二次创作的坎贝尔案中,法院又从其对版权法本身目的的理解中推导出转化性使用检验标准,再次扩展了合理使用的适用空间,避免对合理使用采用僵化、明线式的认定方法。这一认定路径在21世纪数字化浪潮的谷歌图书案中得以延续,法院通过揭示扫描图书以构建全文可检索数据库与图书原初用途的功能差异,再次确立了合理使用的先例。正是此种灵活的司法认定方式,使得美国版权体系既能应对新技术所引发的不可预见的纠纷,又能为产业革新预留制度弹性空间。因此,在难以预先判断某项新兴技术具体影响的情况下,合理使用显然可以为技术的涌现提供必要的空间,避免通过强制性规则将复制合法性争议简化为技术开发者与权利人之间的零和博弈。
在立法上,联邦最高法院在索尼案中确立“技术中立”原则以来,美国国会也通过后续立法完善了相关的制度设计,为数字环境中的权利人提供更多保护。1992年《家庭录音法案》构建技术改进与补偿机制,要求数字录音设备制造商植入防复制系统并向着作权人支付法定标准的版税。1998年《数字千年版权法案》则创设了技术保护措施制度,对数字作品权利人采取的技术防御手段给予法律保护,同时设置规避技术措施的禁止性规范。然而,该法案第1201条同时涵括了一项重要的豁免机制,即每叁年一次的规则制定程序,允许公众申请对某些特定用途的规避行为进行临时性豁免。该项豁免机制能够在禁止技术规避措施的大框架下,通过定期调整的“安全阀”,确保法律不阻碍技术创新与合理使用。但国会仍持审慎监管的思路,对豁免范围予以严格限定。2021年第八个叁年期规则制定当中,基于谷歌图书案的先例,版权局将电影与文学作品的文本数据挖掘纳入临时豁免范畴,但同时限制该项豁免仅限于非营利高等教育机构适用。随后,第九个叁年期规则制定时,版权局延长了该项豁免期限并将豁免对象扩展至关联研究机构,但仍对商业性文本数据挖掘持观望态度。此种“先创新,后监管”的路径在技术发展初期为美国带来了巨大的技术优势,避免了过度监管对创新的扼杀。待技术成熟后再基于技术实际影响设置精准化治理,既防止了完全自由放任导致的市场失序,同时兼顾了保护与发展的需求。
在人工智能机器学习使用作品的合法性问题上,美国多数人工智能模型训练案件尚在审议之中,诸被告所提出的合理使用抗辩均以谷歌图书案为基础,主张变革性技术可以在内部利用现有作品,即不传播作品以达到新的有用目的。尽管汤森路透在与Ross Intelligence的人工智能训练诉讼中取得了初步胜利,但该判决的辐射效力受制于其特殊的案情要素。不同于该案,其他未决的生成式人工智能案件中,被告被指控的复制行为往往出于与原使用目的不构成竞争关系的训练用途。因此,生成式人工智能模型训练案件仍有可能延续谷歌图书案的合理使用分析框架。相比于司法对模型训练输入端的审慎介入,输出端的可版权性问题在美国基本达成了一致共识。即使版权法具备随技术发展而变化的灵活性,但美国仍无意扩大保护范围,因此,明确将人工智能排除于创作主体之外,同时通过表达控制力标准,将复杂提示词引导生成的过程视作用户对人工智能生成内容的接纳,而并非对作品具体表达元素的实质掌控。此种输入端与输出端的双轨治理范式,本质上与美国“创新优先”的政策选择相契合,即在输入端给予合理使用弹性空间以维持技术迭代,在输出端则通过严格独创性审查防止无序扩张。
(二)欧盟:自然权利观下的保护倾向
美国版权法长期以功利主义为理论基础,通过激励机制来推动创新与经济发展。而多数欧洲国家秉持的作者权法体系则植根于自然权利理论,强调对作者权益的严格保护。此种差异直接塑造了两大法域迥异的制度逻辑。因此,不同于“以制度弹性换取技术红利”的宽口径策略,欧盟要求技术使用应事先适配着作权规则。欧盟在《信息社会版权指令》第5条中,就通过封闭式列举对着作权例外情形作出严格限定,并要求绝大多数例外条款限于非商业性用途。各成员国无法突破指令的范围在新领域创建例外。随着数字化浪潮的到来,现有指令亟待调整。该指令下的临时复制条款因受制于限缩性解释的要求,难以覆盖绝大多数文本数据挖掘场景。而私人复制例外条款既排除直接或间接性的商业使用,又限制机构或研究人员集体使用,也无法为此提供有效豁免,仅第5(3)(补)条中的科学研究例外为非商业性研究目的的文本数据挖掘提供了适用的可能。
为了避免既有制度框架可能制约创新与经济增长,当时仍为欧盟成员国的英国率先开启了文本数据挖掘例外的立法进程。2010年,英国首相宣布对知识产权制度框架进行独立审查,以最大限度支持创新和增长。基于此,伊恩·哈格里夫斯(Ian Hargreaves)教授受托撰写报告对英国的知识产权制度框架进行战略性改革提出建议。根据该报告的调查,美国的开放式合理使用条款无法直接移植到欧洲,所以政策制定者面临的挑战是:如何在列举式的例外制度框架内,设计既适配当前技术形态又适应技术迭代的例外条款。对此,报告建议英国采取双轨方式:在符合欧盟框架性规定的前提下,先寻求在国内增加例外规定,同时在欧盟层面推动引入新的例外条款,允许在不直接利用作品的基本创作和表达目的的情况下通过技术手段使用作品。英国政府接受了全部建议,承诺大幅开放版权例外制度,包括创建有限私人复制例外、扩大非商业研究以涵括文本数据挖掘以及引入戏仿例外等,并于2014年正式通过了立法。由于修订是在《信息社会版权指令》第5(3)(a)条所提供的框架内进行,英国文本数据挖掘例外条款的适用范围非常狭窄。首先,该条款要求使用者不能简单地抓取他们所需的数据,而是必须获得每个版权所有者的许可或检查每个数据集的条款,以确保它可以被合法访问。因此,该例外仅意味着获权阅读版权作品的研究人员能够复制作品用于非商业目的的文本数据挖掘,而无须获得额外的许可。其次,该条款仅限于非商业研究目的的计算分析。对于目的“非商业”性的解释,根据《信息社会版权指令》序言第42条,行为是否具有商业性应由该行为本身决定,行为所依托的机构性质并不是决定性问题。最后,该条款限制研究人员以任何方式共享、出售或公开提供副本。
除英国外,其他欧盟成员国也引入了类似的文本数据挖掘例外。2016年,法国修订《知识产权法典》,引入第尝122-5条第10款、第尝342-3条第5款,允许公众和研究人员分析其合法获取的科学数据。2017年,德国修订着作权法,对其第60诲条用于科学研究目的的文本和数据挖掘的例外,明确限定适用主体为研究机构、图书馆和博物馆,以及个人研究人员。例外情况包括进行文本数据挖掘所必需的复制行为,为保证质量向特定范围内的人员提供用于共同科学研究的语料库,以及向个别第叁方提供语料库。与英国、法国不同,德国未规定合法获取资料来源的要求。
除少数国家创设文本与数据挖掘例外,多数欧盟成员国对此仍处于立法真空状态。各成员国在专门例外条款上的缺失,导致文本数据挖掘的合法性始终受制于立法差异化所产生的规范裂隙。针对上述困境,同时为构建具有灵活性与全球竞争优势的治理范式,欧盟委员会明确将文本数据挖掘列为数字单一市场建设的重要议题。但此时欧盟的探索仍囿于许可框架,试图在各方沟通协商的基础上推动以行业为主导的解决方案,如标准许可协议。直到2015年,欧盟才放弃了这一从许可上突破的方案。欧盟委员会在2015年5月通过的《数字化单一市场战略》中明确,有必要减少各国着作权制度中存在的差异,并允许用户更广泛地访问在线作品,增加用户通过网络接触作品的机会。统一的例外规定,为出于研究、教育、文本数据挖掘等特定目的的跨境使用提供了更高的法律确定性。在这一计划之下,欧盟委员会公布了《数字化单一市场版权指令》草案,其中第3条为受版权保护客体的复制权、特殊数据库提取权及新闻出版商邻接权拟设了以科学研究为目的的文本数据挖掘例外。该条虽突破了《信息社会版权指令》第5条的一般结构,要求文本数据挖掘例外为各成员国所强制实施,却设置种种限制要件对文本数据挖掘形成结构性约束。其中第3条第1款规定的“合法访问”要件仍使科研机构受制于出版商设定的许可条件。同时,条款适用范围也十分有限,“科学研究目的”“研究机构”要件排除了公众群体广泛获益的可能。其本质上仍然是将权利人控制的逻辑嵌入例外制度之中,未能根本消解科研自由与商业壁垒的规范张力。在立法协商进程中,欧盟逐步意识到文本数据挖掘在商业决策、公共政策分析等非科研领域的广泛应用前景,最终在2019年正式通过的《数字化单一市场版权指令》中对文本数据挖掘例外范围进行了扩张,增加了第4条,允许任何合法获取内容的个人或机构实施文本数据挖掘。
尽管统一的文本数据挖掘框架能够为跨境科研协作提供一定的确定性,但限制性极强的例外条款仍将许多创新主体排除在制度红利之外。《数字化单一市场版权指令》第3条引入了双重限制,明确例外适用的主体为“研究组织和文化遗产机构”。根据该指令序言第12条、第13条的解释,研究机构须在非营利的基础上或者在国家承认的公益使命范围内开展活动。为公共利益开展项目的独立研究人员或者受商业公司控制影响的科研机构被排除在该条之外。同时,“科学研究”被定义为包含自然科学与人文科学的研究,定义的模糊性将使得某些难以被简单二分的科学研究行为无法被涵盖其中,导致对第3条适用范围的限制性解释。除科学研究外,非营利机构也无法出于教育或管理等其他目的适用该条。此外,根据该条第3款,文本数据挖掘例外与技术保护措施并存,并且权利人采取技术措施的范围不受版权例外的限制。尽管序言第16条强调,技术措施不得损害例外的有效适用,但序言本身不具备独立的法律效力。二者规定的不一致性可能变相削弱,甚至完全阻碍例外条款的实际效力。虽然指令第4条并无主体和使用目的的限制,但该条的实际影响十分有限。例外适用仍取决于标的物是否可以合法获取,以及权利人是否保留权利。指令序言第15条明确“合法获取”包括根据开放获取政策或合同安排等合法方式获取内容。根据该要求,出版商可能直接将文本数据挖掘纳入订阅费中,显着提高了研究成本。不仅如此,赋予权利人为文本数据挖掘行为保留复制权的自由,可能在实践中阻碍第4条例外规定的适用,甚至完全违背其促进创新的预期目的。根据指令序言第18条的解释,在线数字内容的权利保留须以机器可读的方式作出,而其他情况下则可以通过协议或单方面声明等方式保留权利。然而,权利保留的标准并未明晰。当前被广泛使用的谤辞产辞迟蝉.迟虫迟标准缺乏基于使用场景的差异化授权能力,无法提供权利人所需的对作品使用的精细控制。在此情况下,权利人更倾向于将文本和数据挖掘的权利货币化,而不是选择开放。为促进权利保留的实施,欧盟通过《人工智能法案》第53(1)(肠)(诲)条为权利人提供了双重保障:一方面,要求开发者将权利保留规范内嵌至技术架构设计之中;另一方面,通过施加训练数据透明化披露的强制义务使权利人可实施权利管理。然而,《数字化单一市场版权指令》所述的权利保留从语义上来看仅针对的是尚未被使用的语料。同时,在已对文本数据挖掘设置多重合规要求之下,开发者是否有能力履行该义务仍然是未知数。
虽然欧盟在文本数据挖掘例外立法时还未预料到人工智能的发展,但其所定义的文本数据挖掘行为十分广泛,能够将所有数据驱动型计算分析包括人工智能训练行为涵括其中。因此,本质上欧盟规制的逻辑在于为特定情况下的文本数据挖掘提供合法性,但同时坚持在例外之外的情况需要权利人的许可。除此之外,欧盟还通过长臂管辖,要求在欧盟市场运营的人工智能系统必须符合监管要求。通过“监管先行”的政策路径,欧盟在人工智能治理领域确立了相较于美国更为清晰的权责边界。但严格的合规框架仍将造成负面的外部效应,导致创新主体可能作出“监管套利”或者“战略撤离”的市场抉择。此种预防式监管在降低法律不确定性的同时,实则构筑起了抑制技术创新的高墙。
(叁)日本:支持技术面向的柔性立法
作为大陆法系作者权传统的典型代表,《日本着作权法》第二章第五节对着作权限制的类型作出了严格且详细的说明,这种封闭列举的立法模式在遇到新技术的冲击时,同样面临着改革的需求。但日本在修法上采取的立场,始终是一种拥抱新技术的面向,目标在于如何使着作权制度适应新时代,维系权利保护与使用便利之间的平衡。自2009年始,日本先后制定了针对特定技术场景的权利限制条款,以保障新技术的优先适用。
早在2016年日本就将人工智能定位为实现超级智能社会的技术基础之一,并在此导向下设立了专门的人工智能技术战略委员会。考虑到着作权对数据分析所带来的潜在障碍,日本知识产权战略总部开始积极探索如何在维系权利人合法权益与促进技术创新的价值平衡下构建“适当且灵活的权利限制体系”。次年,文化审议会着作权分科会发布报告,建议在着作权法修订法案中引入此类灵活的限制性规定。具体而言,报告从两个层面探讨了灵活权利限制条款所带来的影响:一是从“事前制定”转向“事后调整”;二是由“立法主导”转向“司法主导”。首先,着作权分科会承认着作权限制制度的不完善是过去日本互联网搜索引擎未能充分发展的原因之一,但同时仍须审慎评估灵活权利限制规定的适当性。灵活性过高的权利限制规定,同样会使用户难以判断使用的合法性,从而增加侵权风险。其次,从立法和司法的关系来看,将政策体现在法律中应当由立法机关进行。在日本尚未形成以诉讼解决纠纷的法律环境的情况下,通过司法途径形成规范的可能性有限。同时,在协调灵活性权利限制规范与“叁步检验法”时,相较于规范的形式特征,实际适用范围的宽窄程度等实质性要素更可能成为是否引入灵活性条款的重要判断标准,制定相关规范时须充分考量这一特点。有鉴于此,着作权分科会认为,灵活性过高的权利限制规定并不符合日本的实际,因此决定采取“多层次”应对方式,通过明确性与灵活性相平衡的规则体,对权利限制进行分类管理,坚持在原有“叁步检验法”的框架下进行改革。
基于上述立场,着作权分科会将权利限制的需求进行优先级划分,其中检索服务、信息分析服务、反向工程、系统后端复制等被列为优先讨论对象。以检索服务为例,报告指出,在海量信息时代,该服务通过提供获取知识的机会,有助于满足国民知情权。同时,检索服务事实上不以提供作品本身为目的,对着作权人对作品的商业性使用的影响程度较低,因此纳入权利限制范围具有正当性。具言之,根据权利人可能遭遇的不利程度,使用行为可分为叁个层次。
其一,通常不损害权利人利益的行为类型,包括在通信设备后端等进行的不以享受作品表达为目的的使用。着作权法所保护的经济价值源于受众为享受作品表达所支付的对价,但这一价值实现机制建立在表达享受行为必然伴随着复制等利用行为的立法预设之上,这便导致客观上仅涉及技术处理而无须感知作品表达内容,或者虽涉及表达感知但基于使用目的或方式,客观上无法被评价为对作品艺术价值的欣赏的行为不恰当地纳入了权利范畴。因此,当使用行为并不涉及对作品表达的享受时,应当将该行为纳入着作权限制范围。
其二,不属于对作品的实际使用且对权利人造成轻微不利影响的行为类型,包括在提供互联网搜索服务时在必要的范围内显示作品的一部分。此类使用行为不会与作品原初着作权市场行为产生竞争关系,但由于以享有表达的方式使用了作品,可能对权利人造成不利影响。因此,为了证明权利限制是正当的,有必要根据作为其依据的社会利益的程度,将对权利人造成的不利影响限制在轻微的范围内。由于影响程度的轻微性,立法机关应当制定“相当程度灵活性”的规定。
其叁,需要与权利人利益协调以实现文化发展等公共利益政策的行为类型,涉及引用、教育、新闻等各种情况的权利限制规定。在此情况下,权利人与社会公益的利益协调是一个需要价值和政策判断的问题,因此明确性优于灵活性。只有在严格根据具体权利限制类型的社会意义进行考量后,才能为每个范围制定具有“适当灵活性”的规定。
此后,日本落实了这一报告所确立的规制路径。2018年,日本国会通过着作权法修正案,对网络搜索引擎、文本数据挖掘等方面的已有规定进行整合,引入叁个柔性条款:第30-4条非享受目的的使用;第47-4条在计算机上使用作品时附带的利用;第47-5条计算机数据处理附随性微量使用及结果提供行为。其中,第30-4条、第47-4条、第47-5条还能够类推适用于其他类似情形,并参照适用于邻接权。
然而,在人工智能机器学习的合法性问题上,着作权人、人工智能开发者、人工智能服务提供者等利益相关者对《日本着作权法》第30-4条适用范围不乏质疑之声。鉴于针对生成式人工智能着作权规制的司法案例积累不足,且行业自治规范的构建尚处于探索阶段,日本文化厅率先发挥政策调适职能,通过听证机制收集多方意见,协同内阁府人工智能战略会议、人工智能时代知识产权研究小组等机构制定非约束性指引填补规范解释空白。2019年,日本文化厅着作权课发布《适应数字化、网络化发展的灵活权利限制规定基本思路》,对修正案中所引入条款的立法宗旨、规范内容及法律解释基准进行说明。其中明确回应人工智能的开发问题,除自身为开发人工智能而复制作品作为学习数据之外,将所收集到的数据提供给第叁方开发人工智能也被纳入非享受性使用而具有合法性。2024年,先后在七国集团启动的《广岛人工智能进程》、人工智能战略会议《人工智能相关问题的初步总结》、知识产权战略总部《知识产权促进计划》的影响下,文化审议会着作权分科会法律制度小组委员会发布《对于人工智能与着作权的意见》,对生成式人工智能开发学习阶段可能存在的享受目的使用情形进行说明。该情形包含以下两类:其一为在对基础模型进行额外学习的过程中,以输出全部或部分创造性表达为目的的作品复制,尤以开发商故意进行的“过度拟合”为典型;其二为在检索增强生成的情况下,构建专用矢量数据库以实现特定作品片段的定向输出。此外,报告还对争议较大的生成内容的风格模仿情形予以回应。据此,生成阶段的表达相似性并不影响学习阶段的行为目的评价,但是高频次的同质表达输出可以作为证明学习阶段存在享受目的的间接事实。为进一步为生成式人工智能发展提供明确指导,文化厅着作权课整合《对于人工智能与着作权的意见》《人工智能时代知识产权研究小组中期总结》及《人工智能运营商指南(1.0版)》中与着作权相关的部分意见,汇总形成《对于人工智能与着作权的清单和指南》,旨在为生成式人工智能各阶段参与主体提供合法性论证和风险控制方案。
可见,日本人工智能着作权规制模式既不同于美国通过判例法扩张合理使用的司法能动路径,也区别于欧盟基于技术规制的立法传统制定的具体权利限制条款,而是呈现出独有的应对路径。立法者创造性地围绕使用行为对权利人影响程度、所涉公共利益大小设计柔性条款,在各层级适配梯度式的灵活性与明确性,并强调政策制定过程中的利益相关方参与,治理过程中的立法、司法、行政与自治相协同,最终实现对生成式人工智能着作权规制需求的快速响应。
四、生成式人工智能着作权规制的本土探索
(一)可版权性认定的稳定性追求
如前所述,在经历了一段时间的争议和论证后,各国在人工智能生成内容的可版权性认定问题上正在形成共识,除坚持将自然人视为作者不动摇之外,使用者仅以输入提示词的方式来生成人工智能内容不得视为创作也逐步得到全面认可。我国现阶段在司法实践中应对人工智能生成内容时,同样延续了既有着作权法的主体、客体的认定标准和逻辑,但在使用者的创作贡献认定上,仍需要进一步根据个案加以区分对待。
从使用者对生成内容的预期和控制来看,显然单纯的操作性指令不足以建立对生成内容中具体表达的控制,必须增加证明提示与最终表达之间存在可追溯的关联。根据我国法院在判决书中的说理,我国与其他国家相同,仍坚持自然人为创作主体的理念。但在坚持人工智能是辅助创作的前提下,输入提示词的使用者被直接视为作者则拓展了智力投入的认定边界,将模型输出的结果等同于使用者的创作。此种“技术过程等同于创作过程”的认定方式,说明我国当前的一些司法裁判实际上是以扩大客体范围的方式来激励人工智能技术应用。但其他国家的立法历程已然表明,无论创作工具如何变革,版权始终激励的是人类创作行为。扩张保护的路径也面临着现实操作的困境,例如,提示词修改次数、参数调整幅度等量化指标能否成为独创性判定的客观标准,以及在提示词市场逐渐形成的背景下,相同提示词生成相似作品时应当如何确定权利归属等问题,都可能在未来引发新的争议。
为实现人工智能生成内容可版权性认定的稳定预期,我国司法裁判有必要在厘清当前人工智能技术特征的前提下,围绕人类创造贡献建立更为细化的评判标准。传统数字工具,如笔丑辞迟辞蝉丑辞辫、颁础顿等软件虽替代了部分由人类手工执行的环节,但其本质上是创作者思维的延伸工具,由用户通过操作界面完全掌控作品细节。而生成式人工智能的创作机制与其存在本质差异,由开发者通过训练数据筛选、模型算法优化及输出规则设定等技术底层设计,实质上主导了生成内容的表达元素与风格取向。如果训练者只使用某一类艺术风格的作品或通过参数调整限制输出内容类型,可以直接决定生成内容的基本表达。在此情况下,使用者仅输入基础指令而未对表达细节施加控制,该行为就不能视为对作品的智力投入。具言之,对于使用者输入复杂提示的场景,可根据创作链的实质贡献划分为以下叁类情形。
第一类为使用者输入本身即构成独创性作品,例如详细的故事脚本或设计图纸。此时,人工智能系统仅作为优化工具,用户通过提示词对内容进行的调整不对作品本身的可版权性认定产生影响。其法律属性类似于作家向他人口述小说情节或使用计算机辅助记录内容。当模型的输入形式与输出形式保持一致时,用户输入的内容往往能直接体现在生成结果中,此时用户的创造性贡献更易于追溯。
第二类为使用者多次输入提示词来指示人工智能生成。生成式人工智能对于用户提示的响应方式是将用户输入的文本提示转化为机器可理解的语义向量,将句子拆解为单个词元,并分析词元间的关联关系。通过注意力机制捕捉提示词及其隐含关系,并构建出生成内容的逻辑。由于用户未对具体表达要素形成实质性控制,仅是提供了预期内容的一般概念,因此无法被视为创作者。其行为本质上类似于业主向建筑师解释所需的建筑物类型和功能,无论业主所表达的想法多么详细,建筑设计图纸也不是由业主创作的。
第叁类为使用者对人工智能前提下可获得汇编权或改编权的保护,即仅保护人类控制的部分。此种分层认定方式,既正视了技术工具对创作过程的革新,又可与传统解释规则保持一贯性。
(二)机器学习使用作品的合法性认定
面对生成式人工智能模型训练,我国需要作出两个层面的政策选择:一是现行法律体系是否需要进行适应性调整;二是法律调整合理使用的路径与尺度。
针对第一个问题,修订法律当然可以直接为机器学习的合法性提供明确预期,降低人工智能开发的合规风险。然而现阶段各国人工智能产业发展的态势表明,法律的明确性并非创新与竞争力的唯一影响因素。脱离技术发展规律的法律调整,反而会造成负面的监管效果。因此,当前决策的关键在于识别技术开发实际与法律介入的时机,既要避免规则缺位引发的市场失序,又要防止过度干预对技术演进产生抑制效应。除此以外,英国的立法经验表明,科学研究例外与机器学习行为具有契合性,在成文法短期内难以制定的情况下,可以对既有科学研究条款进行扩张解释,将非营利性人工智能训练纳入豁免范围。
针对第二个问题,机器学习使用作品的规制方式可分为“立法主导”“司法主导”与“立法、司法协同”叁类。美国为典型的以司法为主导的国家,成熟的诉讼环境使其拥有丰富的案例资源,进一步促使规范的形成。部分国家在进行改革时,放弃了现有的封闭式合理使用框架,转而采用开放式的合理使用模式。然而在大多数国家和地区,此种选择并未转化为实际的立法改革,英国、日本均摒弃了这一政策方案。即使采取了开放式立法的国家,在司法未形成成熟规范的情况下,仍需其他方式来确保法律规范解释的明确性。以色列司法部2022年发布的一份意见书指出,机器学习是使计算机能够从过往数据中自主学习的过程,合理使用通常涵盖机器学习。该意见书不具有法律约束力,但可对法院判决起到一定的指导作用。此外,新加坡也在其版权法中引入了一项独立于合理使用制度的基于目的的例外规定,允许为计算数据分析目的而复制版权材料,而无论商业性与否。尽管开放式立法具有灵活性的优势,但在缺乏案例积累的情况下仍然无法为技术合规提供明确性。除该方案外,欧盟采取了典型的立法主导策略,通过概念定义的广泛性尽可能覆盖更多的技术场景,而后沿袭其传统规制工具在权利限制条款中附加层层要件收紧使用口径。因此,现阶段在欧盟,机器学习行为能否被文本数据挖掘条款所涵盖仍然有待司法解释。区别于传统的规制模式,日本以柔性立法方式划定了机器学习的底线,赋予司法机关更大的解释空间。在司法尚未形成成熟规范的同时,通过文化厅发布的技术指南、意见书等文件为公司和创作者提供适时指引,弥补规范空白。我国需要在研究这叁种路径的基础上作出自己的抉择。
尽管各国应对生成式人工智能的治理路径不尽相同,但总体思路存在一致性,即在维系着作权合理使用制度基本框架的情况下,破除“商业性”与“使用数量”制约,为技术发展预留必要空间。当前我国正处于治理体系构建的关键阶段,需要在两个方面着力:第一,对内搭建多方对话平台,广泛听取技术开发者、创作者及用户等利益相关者的意见,明确技术开发的基本底线并出台操作性指引;第二,对外抓住国际共识尚未形成的窗口期,积极参与全球标准制定,推动形成兼顾技术创新与权利保护的包容性框架。通过此种内外协同的方式,既能避免闭门造车导致的规则滞后,又可防止简单移植域外经验引发的水土不服。
五、结语
生成式人工智能着作权规制已成为全球共同面对的难题,人工智能技术的不可解释性,导致输入端难以追溯训练数据与生成结果的关联,输出端无法清晰界定人类的实质贡献。面对上述问题,全球各国在可版权性认定方面已有基本共识,始终强调以“人类创作”为核心,严守原有着作权框架。同时,在机器学习的合法性认定上表现出积极的改革态势,基于各自产业阶段与法律传统作出了不同的政策选择。作为处于从技术追赶向局部领跑转型关键阶段的国家,我国应当主动塑造规则而非被动适应规则,在全球人工智能治理范式的形成过程中提升中国话语权。