字節(jié)跳動大模型訓(xùn)練被實(shí)習(xí)生攻擊 背后四點(diǎn)真相曝光
字節(jié)跳動大模型訓(xùn)練遭實(shí)習(xí)生攻擊一事引發(fā)網(wǎng)友的字節(jié)真相廣泛關(guān)注,相關(guān)話題隨即登上熱搜。跳動
據(jù)“大廠青年”爆料,大模據(jù)內(nèi)部廠友透露,型訓(xùn)破壞模型訓(xùn)練確有其事,練被但傳聞也有些夸張和虛構(gòu)的實(shí)習(xí)生攻信息。
據(jù)了解,擊背事情發(fā)生在六月底。后點(diǎn)某著名高校博士生田某某在大廠商業(yè)化技術(shù)團(tuán)隊(duì)實(shí)習(xí),曝光因?yàn)閷F(tuán)隊(duì)資源分配不滿,字節(jié)真相使用攻擊代碼破壞團(tuán)隊(duì)的跳動模型訓(xùn)練任務(wù)。
首先,大模受影響的型訓(xùn)業(yè)務(wù)不是該廠的大模型,而是練被商業(yè)化技術(shù)團(tuán)隊(duì)的模型訓(xùn)練任務(wù),也就是實(shí)習(xí)生攻影響了廣告部門。
至于傳聞?chuàng)p失上千萬美元,則是太夸張了。
另外,“實(shí)習(xí)生被送進(jìn)去”是假的,處理方式是辭退,同步行業(yè)聯(lián)盟,同步情況給學(xué)校。
在消息曝出后,該名涉事實(shí)習(xí)生試圖在社交平臺上辟謠,將責(zé)任推給他人,不過很快便遭到了接近字節(jié)跳動人士的否認(rèn)。
據(jù)相關(guān)知情人士在Gitbub上表述,“你(指田某)在長達(dá)2個(gè)月的時(shí)間里對集群代碼進(jìn)行惡意攻擊,對公司近30位各級員工造成巨大傷害,讓你的同事近一個(gè)季度的工作白費(fèi)。所有的記錄和審查都證明這是不容狡辯的事實(shí)!”
據(jù)悉,田某某利用了Huggingface(HF)平臺的漏洞,在公司的共享模型中寫入了破壞代碼,導(dǎo)致模型訓(xùn)練效果忽高忽低,無法產(chǎn)生預(yù)期的訓(xùn)練成果。
一位前字節(jié)技術(shù)員工表示,“字節(jié)AI Lab的實(shí)習(xí)生權(quán)限和正職員工差異不大,也使得此次事件有了發(fā)生的機(jī)會”,其也對此次事件帶來的惡性影響表達(dá)了擔(dān)憂,“這件事之后肯定會極大地收縮實(shí)習(xí)生的權(quán)限”。