麻省理工學(xué)院發(fā)現(xiàn)更小更容易訓(xùn)練的神經(jīng)網(wǎng)絡(luò),或有望推動技術(shù)改革
神經(jīng)網(wǎng)絡(luò)技術(shù)起源于上世紀(jì)五、六十年代,當(dāng)時叫感知機,擁有輸入層、輸出層和一個隱含層。輸入的特征向量通過隱含層變換達到輸出層,在輸出層得到分類結(jié)果。
盡管人工智能取得了很大的進步,但現(xiàn)在大多數(shù)基于人工智能的產(chǎn)品仍然依賴于“深度神經(jīng)網(wǎng)絡(luò)”。這種網(wǎng)絡(luò)通常非常大,而且訓(xùn)練成本高得令人望而卻步。
麻省理工學(xué)院的研究人員希望改變這一現(xiàn)狀。在今天發(fā)表的一篇論文中,研究人員揭示了神經(jīng)網(wǎng)絡(luò)中包含的“子網(wǎng)絡(luò)”,比之前的網(wǎng)絡(luò)小10倍,而且可以更便宜、更快地進行訓(xùn)練。
為了訓(xùn)練大多數(shù)神經(jīng)網(wǎng)絡(luò),工程師給它們提供大量的數(shù)據(jù)集,但這可能需要幾天的時間和昂貴的GPUs。
來自麻省理工學(xué)院計算機科學(xué)和人工智能實驗室(CSAIL)的研究人員發(fā)現(xiàn),在這些訓(xùn)練有素的網(wǎng)絡(luò)中,有更小的子網(wǎng)絡(luò),可以做出同樣準(zhǔn)確的預(yù)測。
CSAIL所謂的“彩票假說”就是基于這樣一種觀點,即訓(xùn)練大多數(shù)神經(jīng)網(wǎng)絡(luò)就像買所有的彩票,以確保中獎。相比之下,訓(xùn)練子網(wǎng)就像只買有獎的那張彩票一樣。
問題在于,研究人員還沒有想出如何在不構(gòu)建完整神經(jīng)網(wǎng)絡(luò)的情況下找到這些子網(wǎng),然后修剪掉不必要的位。研究人員目前還沒有找到這些子網(wǎng)絡(luò)的方法。
如果他們能找到一種方法跳過這一步,直接進入子網(wǎng)絡(luò),那么這一過程可以節(jié)省數(shù)小時的工作。并使訓(xùn)練神經(jīng)網(wǎng)絡(luò)不僅僅對大公司開發(fā)而且對單個程序員開放。
但是,如何有效地找到子網(wǎng)絡(luò),并明確為什么有些子網(wǎng)在訓(xùn)練上比其他子網(wǎng)表現(xiàn)地更好,可能會讓研究人員忙上幾年。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 特斯拉工人被故障機器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 AI 時代,阿里云想當(dāng)“安卓” ,那誰是“蘋果”?
- 4 硬剛英偉達!華為發(fā)布全球最強算力超節(jié)點和集群
- 5 谷歌“香蕉”爆火啟示:國產(chǎn)垂類AI的危機還是轉(zhuǎn)機?
- 6 機器人9月大事件|3家國產(chǎn)機器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 7 拐點已至!匯川領(lǐng)跑工控、埃斯頓份額第一、新時達海爾賦能扭虧為盈
- 8 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進軍好萊塢
- 9 美光:AI Capex瘋投不止,終于要拉起存儲超級周期了?
- 10 華為已殺入!AI領(lǐng)域最熱黃金賽道,大廠的數(shù)字人美女讓我一夜沒睡著覺