虛假賬號(hào)不斷進(jìn)化,AI能做的還是有限
你的社交平臺(tái)擁有多少個(gè)粉絲?
一千?一萬?還是更多?你知道其中存在多少個(gè)“僵尸粉”嗎?
近日,據(jù)美國權(quán)威科技媒體The Information引述研究機(jī)構(gòu)Ghost Data的報(bào)告稱,2015年,Instagram平臺(tái)的僵尸賬號(hào)占比為7.9%,到目前已經(jīng)攀升至9.5%。Instagram的閱讀用戶已經(jīng)增加到了十億人。根據(jù)上述比例,Instagram平臺(tái)上現(xiàn)在大約有9500萬個(gè)僵尸賬號(hào)。
有媒體評論指出,如此規(guī)模的“僵尸賬號(hào)”,讓Instagram成為下一個(gè)互聯(lián)網(wǎng)行業(yè)打擊假新聞、假信息和政客營銷的重要陣地。
為什么這么說 ,恐怕得看看“網(wǎng)絡(luò)水軍”在近些年的“杰作”。 2017 年,至少有 18 個(gè)國家在選舉中遭遇了線上操縱和虛假信息策略,包括德國聯(lián)邦總統(tǒng)選舉期間社交機(jī)器人活躍和垃圾新聞?lì)l出等。
顯然,治理“網(wǎng)絡(luò)水軍”已成為全球難題。而由于其分散、量大兼具技術(shù)隱蔽性,對其的治理更需要講究專業(yè)化和智能化。此時(shí),人工智能也派上了用處。
道高一尺,魔高一丈,虛假賬號(hào)與AI的斗智斗勇
從創(chuàng)建應(yīng)用軟件、官方網(wǎng)站或內(nèi)容傳播平臺(tái),到生產(chǎn)具有實(shí)質(zhì)性內(nèi)容的圖像、視頻或文字,通過或真或假或自動(dòng)地與用戶交互,虛假賬號(hào)已經(jīng)越來越“真實(shí)”。就在去年,有研究表明,連人工智能都可以被用來生成復(fù)雜的點(diǎn)評信息,而這些虛假的點(diǎn)評不僅機(jī)器無法檢測出來,就連人類讀者也分辨不出來。
虛假賬號(hào)不再“虛假”,整個(gè)社交網(wǎng)站都面臨著潛在卻嚴(yán)重的沖擊。智能相對論(aixdlun)分析師顏璇梳理了三種智能“鑒粉”方式,分別囊括了用戶行為、內(nèi)容和情感特征三種形式,試圖解決這一問題。
首先是用戶行為特征的分析。這種方式大多依托于爬蟲技術(shù),即通過主動(dòng)爬取特定微博或者論壇的主體相關(guān)的注冊行為、社交行為、轉(zhuǎn)發(fā)與評論等行為 , 從而進(jìn)行多維特征向量刻畫。同時(shí),有研究者還采用了隱馬爾可夫模型來對用戶行為進(jìn)行建模,利用模型參數(shù)來對用戶行為進(jìn)識(shí)別和分類,畢竟“僵尸”掉進(jìn)了“植物”里,總是有區(qū)別的。
這主要是利用賬號(hào)之間的社會(huì)關(guān)系來識(shí)別那些“僵尸號(hào)”。而面對這種方式,水軍們也“與時(shí)俱進(jìn)”,比如一些職業(yè)差評師的賬號(hào)在注冊行為上就無懈可擊,他們的賬號(hào)一般會(huì)同時(shí)配備有身份證、用戶手持證件照、實(shí)名手機(jī)號(hào)碼卡、實(shí)名銀行卡等,還能通過作弊軟件騙過實(shí)名認(rèn)證系統(tǒng)。即使是微博里的“僵尸粉”,也會(huì)存在一些粉絲關(guān)系。
第一種方式被“見招拆招”,AI也不得不拿出第二種方式,即對內(nèi)容特征的分析;趦(nèi)容分析的識(shí)別技術(shù)主要從發(fā)帖內(nèi)容本身切入 ,建立“僵尸粉”、惡意或者美化信息等本體模型, 同時(shí)建立敏感語義庫,通過語言特征統(tǒng)計(jì)區(qū)分虛假賬號(hào)。
但是,由于語義領(lǐng)域的不統(tǒng)一性,同一本體在不同領(lǐng)域,甚至同一領(lǐng)域都會(huì)存在很多象征意義的現(xiàn)狀,比如用戶在討論某手機(jī)時(shí),提到“這手機(jī)的上網(wǎng)速度真快”,“快”是一種夸贊,如果說“這手機(jī)耗電速度真快”,“快”又變成了一種批評。因此,內(nèi)容特征模型在不同的情況、平臺(tái)上都會(huì)有較大的變化,這也造成了AI分析內(nèi)容特征進(jìn)而識(shí)別“僵尸粉”的通用性較差的問題。
如此來看,基于單一特征對虛假賬號(hào)進(jìn)行識(shí)別還是比較困難的,因此,AI也不得不開始思考第三種方式。第三種方式源于第二種方式,即對內(nèi)容中情感特征的分析。
有研究者通過分析推特內(nèi)容中的情感,發(fā)現(xiàn)在線社交網(wǎng)絡(luò)中的內(nèi)容創(chuàng)建、傳播與證券市場波動(dòng)、期貨商品價(jià)格及國家、社會(huì)重大事件之間有著緊密的聯(lián)系。這也表明情感傾向是社交網(wǎng)站內(nèi)容中的重要特征。
而水軍也往往帶有強(qiáng)烈的感情色彩(好評或差評),針對單個(gè)發(fā)帖的情感傾向性,AI可以設(shè)定一個(gè)閾值,若對某個(gè)主題發(fā)表的正面或者負(fù)面帖子比例超過設(shè)定閾值,,則認(rèn)為該用戶為水軍。
但是,用于虛假賬號(hào)監(jiān)測的內(nèi)容和情感特征的融合,屬于比較明顯的特征,而忽視了隱藏式的異常用戶,比如用戶上傳與文字內(nèi)容沒有任何關(guān)系的圖片, 抑或者用戶評論情感與用戶打分不匹配等新特征。

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
即日-11.25立即下載>>> 費(fèi)斯托白皮書《柔性:汽車生產(chǎn)未來的關(guān)鍵》
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
11月28日立即下載>> 【白皮書】精準(zhǔn)洞察 無線掌控——283FC智能自檢萬用表
推薦專題
-
8 每日AI全球觀察
- 1 特斯拉工人被故障機(jī)器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 AI 時(shí)代,阿里云想當(dāng)“安卓” ,那誰是“蘋果”?
- 4 拐點(diǎn)已至!匯川領(lǐng)跑工控、埃斯頓份額第一、新時(shí)達(dá)海爾賦能扭虧為盈
- 5 硬剛英偉達(dá)!華為發(fā)布全球最強(qiáng)算力超節(jié)點(diǎn)和集群
- 6 隱退4年后,張一鳴久違現(xiàn)身!互聯(lián)網(wǎng)大佬正集體殺回
- 7 L3自動(dòng)駕駛延期,逼出車企技術(shù)自我淘汰
- 8 谷歌“香蕉”爆火啟示:國產(chǎn)垂類AI的危機(jī)還是轉(zhuǎn)機(jī)?
- 9 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進(jìn)軍好萊塢
- 10 機(jī)器人9月大事件|3家國產(chǎn)機(jī)器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 生產(chǎn)部總監(jiān) 廣東省/廣州市
- 資深管理人員 廣東省/江門市
- Regional Sales Manager 廣東省/深圳市
- 銷售總監(jiān) 廣東省/深圳市
- 結(jié)構(gòu)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 自動(dòng)化高級工程師 廣東省/深圳市
- 技術(shù)專家 廣東省/江門市
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 封裝工程師 北京市/海淀區(qū)