近期,AI“投毒”隱蔽產(chǎn)業(yè)鏈被曝光,這種通過(guò)惡意數(shù)據(jù)污染AI模型的行為,不僅擾亂商業(yè)秩序、影響信息傳播,更會(huì)危害國(guó)家安全。國(guó)家安全機(jī)關(guān)發(fā)布安全提示。
所謂“數(shù)據(jù)投毒”,是通過(guò)向AI大模型訓(xùn)練數(shù)據(jù)中注入偽裝成正常樣本的惡意數(shù)據(jù),實(shí)現(xiàn)削弱模型性能、降低準(zhǔn)確性的攻擊方法,常被用于惡性市場(chǎng)競(jìng)爭(zhēng),甚至可能涉及間諜活動(dòng),日益呈現(xiàn)出鏈條化、隱蔽化、跨境化特征。不法分子借助GEO(即生成式引擎優(yōu)化)工具批量、高權(quán)重生成虛假內(nèi)容,如虛構(gòu)產(chǎn)品介紹、虛假測(cè)評(píng)、惡意對(duì)比信息等,定向投放至各類網(wǎng)絡(luò)平臺(tái)。AI大模型在訓(xùn)練與檢索增強(qiáng)生成階段會(huì)自動(dòng)抓取網(wǎng)絡(luò)信息,少量虛假內(nèi)容經(jīng)迭代學(xué)習(xí)后就能固化為所謂“標(biāo)準(zhǔn)答案”,最終輸出失真結(jié)果。

而對(duì)模型進(jìn)行“投毒”的方式則更具隱蔽性與危害性,不法分子會(huì)通過(guò)模型微調(diào)、插件植入、接口篡改,在模型權(quán)重中嵌入觸發(fā)式惡意指令。模型日常運(yùn)行并無(wú)異常,但遇到特定關(guān)鍵詞、產(chǎn)品類別時(shí)會(huì)自動(dòng)輸出預(yù)設(shè)虛假信息,可定向操控榜單、誤導(dǎo)專業(yè)認(rèn)知,難以被常規(guī)審核識(shí)別,對(duì)政務(wù)、醫(yī)療、金融等關(guān)鍵領(lǐng)域AI應(yīng)用構(gòu)成直接威脅。當(dāng)前AI“投毒”已形成完整黑灰產(chǎn)業(yè)鏈,從技術(shù)開(kāi)發(fā)、內(nèi)容生成、賬號(hào)注冊(cè)到批量投放、刷量控評(píng)、榜單操控環(huán)環(huán)相扣,部分鏈條呈現(xiàn)跨境特征,極易被境外勢(shì)力利用。
AI“投毒”不僅侵害消費(fèi)者權(quán)益、擾亂市場(chǎng)秩序,還可能對(duì)國(guó)家政治安全、數(shù)據(jù)安全、社會(huì)安全等造成系統(tǒng)性、長(zhǎng)期性危害。國(guó)家安全機(jī)關(guān)提示,AI運(yùn)營(yíng)者要切實(shí)履行主體責(zé)任,嚴(yán)格核查語(yǔ)料來(lái)源,建立可追溯機(jī)制,筑牢防范虛假信息的第一道防線;消費(fèi)者也應(yīng)提高自身辨別能力,警惕AI給出的可疑推薦,發(fā)現(xiàn)問(wèn)題應(yīng)及時(shí)舉報(bào),形成全民監(jiān)督的良好氛圍。