- 1、本文档共13页,其中可免费阅读5页,需付费169金币后方可阅读剩余内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
从“不正当竞争”角度思考AI模型训练中“爬虫行为”的违法边界——欧盟与中国之比较燕
引言
当前,生成式人工智能(generativeartificialintelligence,以下简称“生成式AI”)的发展突飞猛进,而此过程需要海量数据的支持,尤其是在模型训练阶段。故而,实践中很多生成式AI模型的训练往往依赖于爬虫工具从互联网上大量爬取数据。[1]例如,OpenAI公司的ChatGPT模型曾通过互联网爬取第三方网站中的电子书籍、文章、数据库等570GB、超过3000亿个单词用于训练AI模型。[2]
然而,在AI模型训练中的爬虫行为如火如荼开展的同时,也需警惕爬虫行为所带来的以下几方面法律风险:
(1)知识产权侵权:当AI公司对第三方网站上受版权保护的内容,如文
您可能关注的文档
- 中国介入医学白皮书(2021 版).pdf
- 中亚学院季度经济监测报告-第十二期.pdf
- 2024年中国营销趋势报告.docx
- 2024中国低空经济产业发展现状.docx
- similarweb:2024亚马逊会员日全球电子消费趋势报告 -2024 年 7 月 Prime Day 结果 优胜产品.docx
- 北京大学国家发展研究院:2024年7月气候政策与绿色金融(季报).docx
- 本特利大学:商业与社会报告 Bentley-Gallup Business in Society Report.docx
- 财富:2024年《财富》世界500 强排行榜.docx
- 大众在休闲垂钓产业中的消费偏好问卷调查报告.docx
- 东南亚企业出海中国的机遇和政策.docx
- 2021-2022学年湖南省常德市安乡县四年级上学期期中语文真题及答案.pdf
- 2023-2024学年河南省南阳市社旗县四年级上学期期中数学真题及答案.pdf
- 2022-2023学年云南省曲靖市四年级下学期期末数学真题及答案.pdf
- 2021-2022学年河南省周口市鹿邑县二年级下册月考语文真题及答案.pdf
- 2018年河南焦作解放区教师招聘考试真题及答案.pdf
- 2019年江西公务员行测考试真题及答案-乡镇.pdf
- 2019中国石油报社应届高校毕业生招聘试题及答案解析.pdf
- 光大银行招聘应届毕业生能力素质测试笔试真题及答案.pdf
- 2024年广西百色教师招聘考试模拟题及答案.pdf
- 2021-2022学年浙江绍兴诸暨市五年级上册语文期末试卷及答案.pdf
文档评论(0)