实务问答丨解码生成式AI的知识产权问题:模型保护、侵权责任与出海合规

蒋南頔

2024/12/26

在数字化时代,企业正越来越多地使用生成式人工智能(Generative AI)来提升竞争力和创新能力。生成式AI的应用不仅优化了内容生成效率、降低了运营成本,还推动了营销策略的创新,但同时,企业也面临着相应的法律风险与挑战。目前,全球许多国家和地区对于人工智能相关的立法都展开了讨论或已经开始逐步推进立法程序,司法和执法实践也随之不断发展变化。

聚焦生成式AI的模型/算法与训练数据的保护、AI输出内容的侵权风险以及模型产品出海的合规问题等多个焦点议题,我们从与威科先行、战略合作伙伴罗思国际联合编撰的《知识产权前沿热点实务问答手册》《第一章:生成式人工智能(Generative AI)与知识产权保护》中精选了3个生成式 AI 知识产权热门问答与您分享。

 

精选实务问答

 

Q:【AI模型的知识产权】生成式AI模型/算法、训练数据可以受到知识产权保护吗?

A: 本题所指的“生成式AI模型/算法”指的是包含数据训练和内容生成的过程,具有分析输入数据的能力,并基于输入数据生成内容等特点的模型/算法。

生成式AI模型/算法、训练数据的知识产权保护可以考虑以下几个角度:

• 著作权:由于生成式AI模型/算法可能包含源代码、算法,从著作权的角度来说,源代码和算法本身可能构成计算机软件作品,在此基础上生成式AI模型/算法可以得到著作权法保护。而训练数据也可能因为包含著作权作品内容,或者构成改编、汇编作品,从而受到著作权法保护。

• 专利:如果某个生成式AI模型具有独特的技术、方法或应用,比如主要的创新点在于模型的训练过程等,也可以考虑作为技术方案申请专利进行保护。特别是,对于较为容易被逆向工程的AI模型/算法而言,其也更适合选择以公开换保护的专利保护方式,从这个角度来讲,选择专利保护会比选择下文提到的商业秘密保护更为明智。但需要提示的是,专利保护在证明AI模型/算法的创新性和非显而易见性上可能存在挑战。

• 商业秘密:商业秘密是指不为公众所知晓、具有商业价值并且经权利人采取保密措施的技术/经营信息。因此,尚不为公众知晓的具有商业价值的内容,理论上只要做好保密措施,就能以商业秘密进行保护。相比著作权、专利保护存在期限限制的特点,商业秘密保护的优势在于,只要AI模型/算法仍处于保密状态,对其的保护就可以一直延续。AI模型/算法具有商业价值,可以为开发主体获得优势和利益,因此,也可以通过采取保密措施的方式,将其作为商业秘密进行保护。特别是,对于不容易被逆向工程获得的AI模型/算法,以及价值持续期比著作权、专利保护期要长的AI模型/算法,商业秘密保护会是一个更为明智的选择。

• 反不正当竞争法和民法项下财产性权益:如上所述,第一,AI模型/算法是开发主体耗费了人力、物力、财力,历经程序编写、数据收集、整理等过程才最终生成的,第二,AI模型/算法具有商业价值,能够为开发主体带来竞争优势、获得经济利益,因此,其有可能作为反不正当竞争法和民法项下财产性权益予以保护。而对于训练数据,就付出成本、具有商业价值的大数据,已经有案例考虑到大数据产品具有上述两大特点,因此认为大数据产品应享有独立的财产性利益[1]

此外,在评估和探讨生成式AI模型/算法的知识产权保护时,需要考虑与公有领域已有算法的区分和边界。

 

Q:【AI生成物侵权】生成式AI输出的内容与他人在先作品构成相似,是否侵权?

A: 生成式AI语境下的著作权侵权问题,其核心为在AI学习阶段,是否未经授权使用过在先作品。AI生成物与他人在先作品相同或实质性近似的情况下,在能够证明或推定AI学习阶段未经授权使用了在先作品时,成立著作权侵权的风险较高。反之,权利人无法证明AI学习阶段被“投喂”了在先作品、现有证据也无法推定AI学习阶段进行了在先作品“投喂”、或者AI模型研发方能够证明AI模型从未接触过该在先作品,则成立著作权侵权的风险较低。

具体而言,AI的学习与创作结果是两个独立的行为,应当分别进行法律评价:

 从AI学习角度,AI模型生成必然涉及对于素材等数据的学习,其中可能包含构成著作权作品的素材。而收集用于“投喂”的著作权作品素材,收集行为本身会构成著作权法意义上的复制行为,将著作权作品用于AI学习和训练的过程亦构成对著作权作品的使用。若前述行为未得到著作权权利人的许可,则会构成侵权。目前,我国《著作权法》中罗列的“合理使用”情形并不包含在AI学习和训练中复制、使用著作权作品,能否抗辩合理使用尚无定论。

 从AI创作角度,鉴于AI创作过程跟人类创作过程不同,加之在AI输入数据和输出结果之间存在“黑箱”效应,对于AI模型的研发方而言,数据输入和结果输出之间存在一定不确定性和不可控性,基于目前的著作权侵权判断逻辑,可能更难主张AI模型在创作过程中存在复制、抄袭等侵权行为。尽管如此,法院和法官仍可能基于推定AI学习过程中存在的复制、使用著作权作品等行为,判定AI模型本身存在著作权侵权问题,具体来说,可能会涉及侵犯复制权、信息网络传播权、改编权等,特别是在上文提到的在先作品是独创性较高的作品或者是已经发表的知名作品的情况下。在广州互联网法院审理的2024粤0192民初113号“奥特曼”一案中,法院采取了著作权侵权中“实质性相似+接触可能”的判断方法。法院认为由AI生成的案涉图片部分与“奥特曼”这一形象的独创性表达构成实质性相似,同时奥特曼作品又享有较高的知名度,因此推定被告具有接触案涉作品的可能,由此认定被告侵犯了原告案涉作品的复制权。其次,法院认定案涉生成图片部分保留了“迪迦奥特曼复合型”作品的独创性表达,并在保留该独创性表达的基础上形成了新的特征,构成对原告作品的改编,侵犯原告对案涉奥特曼作品的改编权。

如前所述,目前我国《著作权法》合理使用制度的司法实践仍然基于法律条文中明确列举的合理使用/权利限制行为,而其中罗列的“合理使用”情形并不包含在AI学习和训练中复制、使用著作权作品。在AI数据训练未被纳入法定合理使用情形之前,较难凭借合理使用免除数据训练阶段被认定侵权的风险。但与此同时,出于鼓励AI技术发展的目的,我们看见学者开始对AI数据训练问题纳入合理使用的必要性展开讨论,政府部门、权威机构也陆续发布了AI相关鼓励政策和指导意见,随着我国对于AI技术发展越来越予以重视,可能会在未来出现放宽趋势,例如将AI学习和训练纳入“合理使用”,或通过其他方式给与一定程度的豁免。

综上, AI生成物的著作权侵权问题目前属于比较前沿、争议较多且尚无清晰定论的问题,建议动态跟进立法及司法实践发展,探寻AI创作的合理使用边界。

此外,还需注意AI创作和AI生成物可能导致的不正当竞争风险(可能涉及《反不正当竞争法》第六条之市场混淆,包括商品化权侵权等,或《反不正当竞争法》第二条之诚实信用原则)、肖像权侵权风险等问题。

 

Q:【生成式AI出海】生成式AI模型产品出海,可能面临哪些知识产权合规问题?

A:  生成式AI模型产品出海,最重要的是关注海外当地对于AI模型产品监管、数据训练等问题的法律规定。具体在知识产权合规层面,以下几点可供参考:

 数据合规。针对数据合规问题,一方面要求训练数据应当获得授权,比如与主要的出版商、版权所有人和第三方数据库等数据主体达成商业合作,尽可能地提高训练数据在包括知识产权方面的合规性。另一方面,对于数据训练行为,目前世界范围内仅有部分国家,如新加坡、日本等对数据训练/机器学习规定了相应知识产权侵权豁免,大部分国家和区域尚未制定明确的豁免政策,或虽然有相应政策,但执行层面仍存在较大不易操作性(如欧盟[2])。建议密切关注各国家和区域的立法及司法动态,制定相应的数据合规策略。

• 披露义务。海外已有一些国家针对AI模型训练数据提出了披露要求,比如在欧盟《人工智能法》中,提出针对通用目的的AI模型,开发者应当起草并公开提供包括著作权数据在内的用于训练通用模型的数据的全面的足够详细的说明。

• 开源义务。海外已有一些国家针对AI模型相关的开源问题进行了规定,如在欧盟的《人工智能法》中提到,针对基于通用目的的AI模型,在开源的情况下应当向下游提供者提供使用模型的广泛文档和指南。更加具体地,对于生成式AI 模型产品而言,在出海过程中,需要关注本产品相关的算法、软件、程序等是否涉及开源问题,以及考虑就该AI模型生成的代码是否需要履行开源义务,以及其对应在用户协议里的体现[3]

 

引用注释:

[1] 杭州铁路运输法院(2017)浙8601民初4034号民事判决;杭州市中级人民法院(2018)浙01民终7312号民事判决。

[2] 欧盟在2019/790指令中,针对私营实体以文本和数据挖掘(text and data mining)为目的进行复制和提取著作权作品在合法渠道获得作品的前提下给予了例外规定。但一方面,该例外以复制和提取在实现文本和数据挖掘目的中是必要的这一条件为基础,且权利人可以通过选择不适用或约定不适用来推翻合理使用的适用可能性,本身适用条件较高;另一方面,此规则还需要等待成员国转化为国内立法,在转化立法过程中部分国家也有可能设置进一步的适用条件。

[3] WIPO - Generative AI: Navigating Intellectual Property

 

其它本章节涵盖的精彩问答:

  • 【定义】什么是生成式人工智能?

  • 【AI 生成物的著作权】利用生成式 AI 输出的图片 / 音乐 / 文字等内容,可以获得著作权保护吗?

  • 【AI 生成物的权利人】生成式 AI 输出的内容,如果可以获得著作权保护,权利人是谁?

  • 【AI 生成物侵权】生成式 AI 输出的内容与他人在先作品的风格高度近似,是否构成侵权?

  • 【数据训练】生成式 AI 模型在训练阶段使用的材料,应当获得哪些授权?

  • 【生成式 AI 服务提供者的责任】提供生成式 AI 服务,用户利用服务生成的内容构成侵权,AI 服务提供者需要承担责任吗?

  • 【提供生成式 AI 服务的平台责任】提供生成式 AI 服务的平台,收到用户举报其生成内容构成侵权的通知后,应当如何处理?

 

本章作者

 

蒋南頔 主任、争议解决业务联席负责人 

路盛律师事务所 北京 

邮箱:ljiang@lushenglawyers.com

张捷 律师

路盛律师事务所 北京 

邮箱:jzhang@lushenglawyers.com

 

申请报告

欲解锁本章节的全部问答内容以及《知识产权前沿热点实务问答手册》整本内容,欢迎您点击本链接申请完整版手册,我们将在3-7个工作日内以邮件的形式发送。

*本资料仅向企业人员发送,感谢理解

关于报告:

《知识产权前沿热点实务问答手册》由威科先行、路盛律师事务所及其战略合作伙伴罗思国际共同精心撰写而成,并于2024年11月正式线上发布。手册由30余名资深知识产权专家编撰而成,精选108个知识产权问题,分为11大章节,汇聚10万字的详尽分析,聚焦于当前业界最为关注的前沿问题,全面覆盖了专利、商标、版权、商业秘密、互联网不正当竞争、知识产权出资以及知识产权惩罚性赔偿等关键领域,以“一问一答”的形式提炼知识产权从业者关注的热点议题,为读者提供最新的法律解读、案例分析和实务操作指导。

报告一经发布就吸引了业界的广泛关注和高度评价。为了更好地分享精彩内容,我们后续将继续从每个章节中精选部分精华问答,以系列文章的形式发布。