私自用6000万用户数据训练大模型，马斯克面临大规模GDPR诉讼

责编：gltian ｜2024-08-16 14:13:16

近日，欧洲隐私倡导组织NOYB对社交媒体巨头X提起GDPR投诉，再次将大模型训练的用户数据隐私问题推至风口浪尖。

据NOYB称，X公司未经告知或征得用户同意，擅自使用超过6000万欧洲用户个人数据训练其大型语言模型“Grok”，这一行为严重违反了GDPR原则。NOYB认为，X公司此举缺乏透明度，且未获得适当的法律依据或用户许可，这在GDPR的框架下是不可接受的。

Grok大模型的训练过程原本悄无声息，但在2024年7月下旬被一位名为@EastBakedOven的用户揭露。该用户在检查X账户设置的变更时，发现了一个默认勾选的设置：“允许您的帖子以及您与Grok的互动、输入和结果被用于训练和微调。”X公司声称，可能会使用这些数据来“微调”Grok，并可能与服务提供商xAI共享。

据悉，爱尔兰数据保护委员会（DPC）已与X公司达成协议，后者同意在9月份前暂停处理个人数据。DPC的公告指出，未经授权的Grok训练发生在2024年5月7日至8月1日之间。对此，NOYB的主席Max Schrems表示，DPC未能深入调查此事的法律层面，仅仅提出实施缓解措施的建议。因此，NOYB决定提起多项GDPR投诉，涉及GDPR多条条款，希望这将促使对违规行为进行彻底调查。

NOYB组织要求X公司解释为何在Grok训练开始两个月后才通知用户，已被用于训练的用户数据集如何处理，以及如何有效区分欧盟和非欧盟个人数据。此外，NOYB质疑为何X等平台仍未提示欧盟用户，以获得使用其数据训练Grok的许可，这是符合GDPR要求的唯一方法。

这起事件凸显了社交媒体数据使用的法律风险，尤其是在GDPR严格的数据保护要求下。今年6月份NOYB组织还曾向11个国家的隐私监管机构投诉Meta的人工智能训练计划，并敦促它们在该公司开始训练下一代Llama之前阻止该公司。

X用户如果不希望X使用其帖子来训练Grok，有两个选择：

第一个选择是将帐户设为私密，但对许多人来说，这会极大影响用户体验。
更好的选择是从桌面登录X站点并单击屏幕底部的“更多”按钮，然后单击“设置和隐私”，选择“数据共享和个性化”下的“Grok”，然后取消选中“允许您的帖子以及您与Grok的互动、输入和结果用于训练和微调”。

声明：本文来自GoUpSec，稿件和图片版权均归原作者所有。所涉观点不代表东方安全立场，转载目的在于传递更多信息。如有侵权，请联系rhliu@skdlabs.com，我们将及时按原作者或权利人的意愿予以更正。

上一篇：网络数据染色技术在移动通信网络流量监管方面的应用思考

下一篇：2024上半年勒索软件受害企业至少支付了32亿元赎金