首页
第249章 国产训练集数据遇
返回

第249章 国产训练集数据遇法律争议

章节报错(免登陆)
下载APP,无广告、完整阅读

一秒记住【笔趣阁小说网】
biquge678.com,更新快,无弹窗!


    长桌上堆满了厚厚的文件夹,每本都贴着不同颜色的标签,红色代表诉讼文件,黄色代表监管函,蓝色代表内部调查报告。
    周明坐在主位,这位法务风控负责人的脸色从未如此凝重。他面前摊开着一份刚刚送达的法律文书,封面上印着某欧罗巴国家数据保护监管机构的徽章,下方是一行醒目的标题:「关于涉嫌违反通用数据保护条例(GDPR)的调查通知」。
    会议室里坐着七个人:周明和他的三位核心法务,赵静和两位「小芯」数据团队的负责人,还有一位从外部聘请的欧罗巴数据合规专家。
    「情况比预想的严重。」周明开口,声音有些沙哑,「这不仅是欧盟数据保护委员会(EDPB)的调查,我们还收到了三家欧罗巴非政府组织的联合起诉,指控我们在训练『小芯』大模型时,非法收集和处理了欧盟公民的个人数据。」
    【记住本站域名台湾小说网超贴心,t????w????k??????a????n????.c????o????m????等你读】
    赵静眉头紧锁:「我们的数据收集流程严格遵守了开源数据的使用规范,所有训练数据都经过了严格的清洗和去标识化处理。怎麽还会涉及GDPR违规?」
    周明调出起诉书的关键段落:「问题出在数据来源的合法性上。根据起诉方的指控,我们使用的部分英文数据集,包含了从欧罗巴网站爬取的公开论坛讨论丶产品评论丶社交媒体内容。虽然这些数据是公开的,但根据GDPR,即使是公开数据,只要能够识别到特定自然人,就属于个人数据,处理需要法律依据。」
    他翻到下一页:「更麻烦的是,起诉方声称我们有『隐蔽爬取』行为,使用技术手段绕过网站的robots.txt协议限制,大量抓取数据。这在欧罗巴某些国家的判例中,可能构成『不正当竞争』或『侵犯网站运营者权益』。」
    会议室里一片沉默。所有人都知道这个问题的严重性。如果指控成立,未来科技可能面临巨额罚款,GDPR规定的罚款上限是公司全球年营业额的4%,对未来科技来说,这可能是数十亿的数额。
    更重要的是,市场声誉的损失将无法估量。一家被认定为「非法收集数据」的AI公司,将很难在国际市场,特别是对数据隐私极度敏感的欧罗巴市场继续发展。
    「我们有什麽辩护依据?」赵静问。
    法务团队的一位资深律师回答:「我们主要依据三点。第一,数据用于学术研究和AI模型训练,属于GDPR第89条规定的『科研例外』。第二,所有数据都经过严格的去标识化处理,无法关联到具体个人。第三,我们的数据收集符合国际通行的合理使用原则。」
    「但起诉方反驳说,『小芯』是商业产品,不属于纯粹的学术研究。」周明补充,「而且他们请了技术专家作证,声称当前的去标识化技术并非绝对可靠,结合其他公开数据,仍有重新识别的风险。」
    欧罗巴数据合规专家,一位五十多岁丶曾在欧盟委员会工作过的德国律师,这时开口:「在
章节报错(免登陆)
下载APP,无广告、完整阅读
验证码: 提交关闭