近日,欧洲隐私倡导组织NOYB对社交媒体巨头X提起GDPR投诉,再次将大模型训练的用户数据隐私问题推至风口浪尖。
据NOYB称,X公司未经告知或征得用户同意,擅自使用超过6000万欧洲用户个人数据训练其大型语言模型“Grok”,这一行为严重违反了GDPR原则。NOYB认为,X公司此举缺乏透明度,且未获得适当的法律依据或用户许可,这在GDPR的框架下是不可接受的。
Grok大模型的训练过程原本悄无声息,但在2024年7月下旬被一位名为@EastBakedOven的用户揭露。该用户在检查X账户设置的变更时,发现了一个默认勾选的设置:“允许您的帖子以及您与Grok的互动、输入和结果被用于训练和微调。”X公司声称,可能会使用这些数据来“微调”Grok,并可能与服务提供商xAI共享。
据悉,爱尔兰数据保护委员会(DPC)已与X公司达成协议,后者同意在9月份前暂停处理个人数据。DPC的公告指出,未经授权的Grok训练发生在2024年5月7日至8月1日之间。对此,NOYB的主席Max Schrems表示,DPC未能深入调查此事的法律层面,仅仅提出实施缓解措施的建议。因此,NOYB决定提起多项GDPR投诉,涉及GDPR多条条款,希望这将促使对违规行为进行彻底调查。
NOYB组织要求X公司解释为何在Grok训练开始两个月后才通知用户,已被用于训练的用户数据集如何处理,以及如何有效区分欧盟和非欧盟个人数据。此外,NOYB质疑为何X等平台仍未提示欧盟用户,以获得使用其数据训练Grok的许可,这是符合GDPR要求的唯一方法。
这起事件凸显了社交媒体数据使用的法律风险,尤其是在GDPR严格的数据保护要求下。今年6月份NOYB组织还曾向11个国家的隐私监管机构投诉Meta的人工智能训练计划,并敦促它们在该公司开始训练下一代Llama之前阻止该公司。
X用户如果不希望X使用其帖子来训练Grok,有两个选择: