行为解读与利益平衡:人工智能训练的著作权合理使用.pdf

行为解读与利益平衡:人工智能训练的著作权合理使用.pdf

此“司法”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

2024年第6期学术研究Academic

行为解读与利益平衡:

人工智能训练的著作权合理使用

文 /杜佳璐

摘要:人工智能在开发阶段面临训练数据来源的著作权合法性问题。在制度层面上,体

现为作品使用新方式的出现对传统合理使用规则的冲击问题;在法理层面上,体现为著作

权人与公众的利益分配问题。鉴于人工智能的数据使用行为是非传统复制行为,考虑到人

工智能产业发展对于大规模训练数据的实际需求与确保公众对作品的适当接近、促进文化

艺术繁荣的公共利益需求,有充分理由将人工智能使用作品进行训练的行为视为一种转换

性使用行为,从而纳入合理使用范畴。同时,为作者提供配套的名誉补偿机制及人工智能

生成内容实质性侵权的救济路径;倡导企业建立共享数据资源库以达成企业经济效益与社

会责任的平衡。

关键词:合理使用;人工智能;训练数据;功能主义;转换性使用

一、问题的提出无法使用大量数据进行训练,人工智能模型的

性能、泛化能力和实用性将受到严重制约,进

人工智能模型的训练过程高度依赖于数据而对人工智能技术在各个行业领域中的应用造

驱动。数据是实现迭代和优化的基础,人工智成负面影响。

能模型通过分析大量的训练数据来提取特征、当前,关于人工智能所涉著作权问题的讨

建立规律。数据量越大,越能发掘潜在的复杂论焦点集中在由人工智能产出内容的作品性质

规律,进而提高人工智能模型的性能和质量。认定及其权利归属之上。这一焦点主要处理的

同时,丰富的数据也有助于人工智能模型在面是输出阶段的著作权问题,但也要注意到,在

对未曾见过的情况时表现出较好的泛化能力,人工智能输入阶段与训练数据相关的著作权问

即能够有效应用于未知场景,实现从特定领域题同样亟待解答,在某种意义上甚至是更为根

人工智能向通用人工智能的转化。因此,如果本的问题。未经适当授权或不符合知识产权法

作者简介:杜佳璐,中国人民大学法学院博士研究生。

2727

2024年第6期学术研究Academic

律法规的训练数据的使用,可能会导致后续输定性与利益衡量两条主线展开,首先分析在目

出内容合法性基础的缺失,从而动摇整个人工前的法律框架下,人工智能使用作品进行训练

智能产品的法律根基,对作品著作权人和训练在行为定性上存在的著作权侵权风险以及作者、

人工智能的相关企业或科研院所的权益造成损企业各自潜在的经济损失;随后结合人工智能

害。使用作品行为的技术特点,阐明其与传统复制

根据既有的著作权理论,著作权侵权通常行为的区别与转换性使用的实质,并对多方利

涉及未经许可复制受保护的作品,或者以某种益进行再考量;最后运用功能主义方法论,从

方式利用作品而未获得原作者授权的行为。我解释论视角证成基于《著作权法》立法目的,

国《著作权法》第三条规定的九种作品类型中,将人工智能使用作品进行训练这一行为纳入合

大多数类型皆可以作为人工智能训练的对象。理使用范围是可行之道。

人工智能不像人类那样能够从作品中自主学习,

而是必须通过使用作品来进行训练。这意味着,二、人工智能训练之著作权侵权风险检视

在构建训练数据集时,无论是完整收录还是部

分提取特征,都不得不对受著作权保护的文字、

您可能关注的文档

文档评论(0)

新能源知识科普(本账号发布文档均来源于互联网公开资料,仅用于技术分享交流,相关版权为原作者所有。如果侵犯了您的相关权利,请提出指正,我们将立即删除相关资料)。

1亿VIP精品文档

相关文档