从专利公开到智能训练:法律挑战与制度回应

李宓

2026/02/09

本文首发于IAM,如需转载,请联系我们。

专利说明书及附图是技术信息的重要载体。一旦由中国国家知识产权局公开,它们便成为社会公开的知识资源。随着生成式人工智能的快速发展,一个关键问题浮现:已公开的专利说明书及附图能否作为人工智能模型的训练数据?在中国,这样的使用会涉及哪些法律与合规风险?

 

————专利说明书及附图的著作权属性与公开要求————

根据《著作权法》,作品必须具备独创性并以有形形式表现。虽然专利说明书及附图在撰写上受到专利法的格式要求,并需经专利行政机关审查后以公告形式公开,但其本质并非行政文件,而是由申请人创作完成的技术文献。只要符合作品的构成要件,即应受到著作权法保护。

在文字表述、语句安排以及附图设计上,专利说明书及附图仍存在创作空间,可以体现作者的个性化选择与“科学之美”。因此,达到最低创造性标准的专利说明书及附图,完全可能构成著作权法意义上的作品。

司法实践对此已有明确认定。例如,在(2021)京73民终4384号 ,北京知识产权法院指出,专利说明书及附图不属于行政性质的文件,国家专利行政机关的审查与公开并不改变其属性。说明书附图在结构安排和线条选择上体现了独创性,应作为图形作品受到保护。类似地,(2022)陕知民终112号案中 ,陕西省高级人民法院强调,专利说明书在技术方案表述、用词选择和语句排列上均具有独创性,属于文字作品,不能因格式要求而否认其著作权属性。

这些案例表明,法院普遍认可专利说明书及附图在满足原创性时应受到著作权保护,而不仅仅是单纯的技术文献。然而,专利说明书及附图的公开目的在于传播技术知识,这一功能也对著作权的行使形成了天然限制。国家专利行政部门在审查和公告过程中,以及社会公众在复制、传播这些文献以获取技术信息时,通常被视为合理行为,只要不影响著作权人的正常使用或造成不合理损害。学界亦指出,专利说明书及附图的技术公开性质决定了其著作权保护范围应当适度收缩,以避免妨碍知识的流通与利用。

 

————AI训练的法律风险与合规框架————

在人工智能的发展过程中,训练数据的合法性始终是核心问题之一。将已公开的专利说明书及附图纳入训练数据,既体现了技术资源的再利用,也引发了著作权法上的复杂考量。若专利说明书及附图具备独创性,则其作为作品受到著作权法保护,训练行为可能涉及复制权或信息网络传播权,从而存在侵权风险。

如何在著作权保护与技术创新之间取得平衡,仍是司法与政策共同面对的难题。中国《著作权法》确立的“三步检验”要求使用必须符合法定情形,不得影响作品的正常利用,也不得不合理地损害著作权人的合法权益。AI训练是否符合这一框架,目前尚无统一结论。尽管训练过程本质上是对作品的分析性使用,而非直接替代原作,但“正常利用”与“合理损害”的界定仍需司法进一步明确。

在司法实践中,上海知识产权法院在2023年的LoRA/奥特曼案提出了“分析性使用”的概念,认为生成式AI训练的目的在于解析作品的思想元素和表达模式,而非复制原作,因此可以认定为合理使用。但法院同时强调,AI服务提供者必须采取措施防止用户生成侵权内容,合理使用并不意味着免责。这一司法实践为AI训练提供了重要参考,但也凸显了合规框架下的责任要求。

与此同时,政策层面的规范正在不断完善。《生成式人工智能服务管理暂行办法》明确要求AI服务提供者在训练过程中使用合法来源的训练数据,尊重知识产权,提升数据的真实性与多样性,并建立透明机制防止生成侵权内容。这些规定不仅为企业提供了合规框架,也意味着即便司法实践对训练行为持宽容态度,企业仍需在制度层面承担合规责任。

在行业实践中,部分AI专利工具开发者表示,其产品基于大型模型(如Google、OpenAI),训练数据涵盖大量公开信息。是否包含专利说明书及附图,往往取决于数据收集策略和著作权合规措施。这表明,行业实践在探索技术可能性的同时,也在不断调整合规路径。尽管著作权风险无法完全排除,但若使用仅限于内部分析与模型优化,且不影响专利说明书及附图的正常利用、不造成对权利人的不合理损害,则可能符合合理使用的要求。为此,企业在实践中应采取多重措施:保存训练数据来源与合规记录,建立内部审查机制,并在合作协议中明确数据使用范围与责任分配。

 

————结论与国际比较————

已公开的专利说明书及附图为人工智能发展提供了重要的数据资源。在中国,将其用于 AI 训练正处于著作权法、合理使用原则与新兴监管要求的交汇点。未来的发展方向可能在于:一方面通过司法判例逐步明确合理使用的边界,另一方面通过政策与行业规范建立可操作的合规框架,从而在推动创新的同时维护知识产权秩序。

在国际比较中,美国版权局于 2025 年 5 月发布的第三份人工智能专题报告重点关注生成式 AI 模型训练 。美国依赖“合理使用”原则,法院在多起涉及搜索引擎与数据挖掘的案例中,倾向于认定分析性使用而非替代性使用可构成合理使用。

欧盟则通过《著作权指令》(2019/790/EU) 确立“文本与数据挖掘例外”,允许科研机构和部分商业主体在特定条件下使用受保护作品,同时赋予权利人“保留权利”的选择,以排除其作品被用于数据挖掘或AI训练。

这种制度差异表明,中国未来在制度设计上既可借鉴美国的判例路径,也可参考欧盟的立法模式,结合自身的知识产权保护与产业发展需求,探索适合的平衡机制。

 

[1] https://wenshu.court.gov.cn/

[2] https://wenshu.court.gov.cn/

[3]https://www.copyright.gov/ai/Copyright-and-Artificial-Intelligence-Part-3-Generative-AI-Training-Re…

[4]https://eur-lex.europa.eu/eli/dir/2019/790/oj/eng

[5]https://wenshu.court.gov.cn/ https://wenshu.court.gov.cn/

[6]https://www.copyright.gov/ai/Copyright-and-Artificial-Intelligence-Part-3-Generative-AI-Training-Re…

[7]https://eur-lex.europa.eu/eli/dir/2019/790/oj/eng