篡改代码并攻击大模型，前实习生被字节跳动起诉并索赔 800 万元

www.nhdbgc.cn 2024-11-27

11 月 27 日消息，据《南方都市报》今晚报道，字节跳动起诉前实习生田某某篡改代码攻击公司内部模型训练一案，已获北京市海淀区人民法院正式受理。字节跳动请求法院判令田某某赔偿公司侵权损失 800 万元及合理支出 2 万元，并公开赔礼道歉。

报道称，田某某本科毕业于北京航空航天大学软件学院，研究生就读于北京大学，研究兴趣为深度学习的优化与算法。字节跳动内部人士表示，之所以此时发起诉讼，是由于田某某为在读博士，公司将其辞退后首先交由校方处理。但在事件处理期间，田某某多次对外否认，称攻击模型训练任务的不是自己，而是别的实习生。考虑到田某某完全没有意识到错误，且涉事行为已触犯公司安全红线，公司最终决定向法院起诉，以表明公司严肃态度、杜绝类似事件再次发生。

附前情提要：

今年 10 月，业界消息称，“某头部大厂的大模型训练被实习生入侵，注入了破坏代码，导致其训练成果不可靠，可能需要重新训练。据称遭到入侵的代码注入了 8000 多张卡，带来的损失可能超过千万美元。”知情人士表示该公司为字节跳动。

根据传闻，某高校的博士在字节跳动商业化技术团队实习，因对团队资源分配不满，使用攻击代码破坏团队的模型训练任务。该田姓实习生利用了 HF（注：huggingface）的漏洞，在公司的共享模型里写入破坏代码，导致模型的训练效果忽高忽低，无法产生预期的训练效果，而且 AML 团队无法核查原因。但传闻曝出之后，该实习生还在某微信群里辟谣称，自己发完论文后就从字节跳动离职，这个当口有另一个人钻漏洞改模型代码，把锅扣到自己头上。

字节跳动后续发布《关于“实习生破坏大模型训练”的事实澄清》：近期有媒体称“字节跳动大模型训练被实习生攻击”，经公司内部核实，确有商业化技术团队实习生发生严重违纪行为，该实习生已被辞退。

涉事实习生恶意干扰商业化技术团队研究项目的模型训练任务，但并不影响商业化的正式项目及线上业务，也不涉及字节跳动大模型等其他业务。

网传“涉及 8000 多卡、损失上千万美元”严重夸大。

经核实，涉事人一直在商业化技术团队实习，并没有 AI Lab 实习经历。其社交媒体个人简介及部分媒体报道有误。

字节跳动