从“不正当竞争”角度思考AI模型训练中“爬虫行为”的违法边界——欧盟与中国之比较燕.docx

从“不正当竞争”角度思考AI模型训练中“爬虫行为”的违法边界——欧盟与中国之比较燕.docx

  1. 1、本文档共13页,其中可免费阅读5页,需付费169金币后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
从“不正当竞争”角度思考AI模型训练中“爬虫行为”的违法边界——欧盟与中国之比较燕

引言

当前,生成式人工智能(generativeartificialintelligence,以下简称“生成式AI”)的发展突飞猛进,而此过程需要海量数据的支持,尤其是在模型训练阶段。故而,实践中很多生成式AI模型的训练往往依赖于爬虫工具从互联网上大量爬取数据。[1]例如,OpenAI公司的ChatGPT模型曾通过互联网爬取第三方网站中的电子书籍、文章、数据库等570GB、超过3000亿个单词用于训练AI模型。[2]

然而,在AI模型训练中的爬虫行为如火如荼开展的同时,也需警惕爬虫行为所带来的以下几方面法律风险:

(1)知识产权侵权:当AI公司对第三方网站上受版权保护的内容,如文

文档评论(0)

4A方案 + 关注
实名认证
服务提供商

擅长策划,|商业地产|住房地产|暖场活动|美陈|圈层活动|嘉年华|市集|生活节|文化节|团建拓展|客户答谢会

1亿VIP精品文档

相关文档