機器學(xué)習(xí)基礎(chǔ) | 監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)的快速入門指南
介紹監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)有什么區(qū)別?
對于機器學(xué)習(xí)的初學(xué)者和新手來說,這是一個常見的問題。答案是理解機器學(xué)習(xí)算法本質(zhì)的核心。如果沒有明白監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)之間的區(qū)別,你的機器學(xué)習(xí)之旅就無法繼續(xù)進行。實際上,這是你踏上機器學(xué)習(xí)之旅之初應(yīng)該學(xué)習(xí)的東西。如果我們不了解線性回歸,邏輯回歸,聚類,神經(jīng)網(wǎng)絡(luò)等算法的適用范圍,就不能簡單地跳到模型構(gòu)建階段。
如果我們不知道機器學(xué)習(xí)算法的目標(biāo)是什么,我們將無法建立一個準(zhǔn)確的模型。這就是監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)的由來。在這篇文章中,我將用例子討論這兩個概念,并回答一個大問題——如何決定何時使用監(jiān)督學(xué)習(xí)或非監(jiān)督學(xué)習(xí)?什么是監(jiān)督學(xué)習(xí)?在監(jiān)督學(xué)習(xí)中,計算機是通過數(shù)據(jù)來訓(xùn)練的。它從過去的數(shù)據(jù)中學(xué)習(xí),并將學(xué)習(xí)到的東西應(yīng)用到現(xiàn)在的數(shù)據(jù)中,以預(yù)測未來的事件。在這種情況下,輸入數(shù)據(jù)和期望的輸出數(shù)據(jù)都為預(yù)測未來事件提供幫助。為了準(zhǔn)確預(yù)測,輸入數(shù)據(jù)被標(biāo)記了正確的類別。
監(jiān)督機器學(xué)習(xí)分類重要的是要先記住,所有有監(jiān)督學(xué)習(xí)算法本質(zhì)上都是復(fù)雜的算法,分為分類或回歸模型。1) 分類模型:分類模型用于輸出變量可以分類的問題,例如“是”或“否”、“通過”或“失敗”。分類模型用于預(yù)測數(shù)據(jù)的類別。現(xiàn)實生活中的例子包括垃圾郵件檢測、情緒分析、考試記分卡預(yù)測等。2) 回歸模型:回歸模型用于輸出變量為實際值的問題,例如唯一的數(shù)字、美元、工資、體重或壓力。它通常用于根據(jù)先前的數(shù)據(jù)觀測預(yù)測數(shù)值。一些比較常見的回歸算法包括線性回歸、logistic回歸、多項式回歸和嶺回歸。
監(jiān)督學(xué)習(xí)算法在現(xiàn)實生活中有一些非常實際的應(yīng)用,包括:文本分類人臉檢測簽名識別客戶發(fā)現(xiàn)垃圾郵件檢測天氣預(yù)報根據(jù)當(dāng)前市場價格預(yù)測房價股票價格預(yù)測等什么是無監(jiān)督學(xué)習(xí)?另一方面,無監(jiān)督學(xué)習(xí)是訓(xùn)練機器使用既沒有分類也沒有標(biāo)記的數(shù)據(jù)的方法,這意味著不能提供任何訓(xùn)練數(shù)據(jù),機器只能自己學(xué)習(xí)。機器必須能夠?qū)?shù)據(jù)進行分類,而無需事先提供任何有關(guān)數(shù)據(jù)的信息。其思想是將機器暴露在大量變化的數(shù)據(jù)中,并允許它從這些數(shù)據(jù)中學(xué)習(xí),以提供以前未知的見解,并識別隱藏的模式。因此,沒有必要定義無監(jiān)督學(xué)習(xí)算法的結(jié)果,相反,它確定了與給定數(shù)據(jù)集不同或有趣的內(nèi)容。這臺機器需要編程才能自動學(xué)習(xí)。計算機需要理解結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。以下是無監(jiān)督學(xué)習(xí)的精確說明:
1)聚類是最常見的無監(jiān)督學(xué)習(xí)方法之一。聚類的方法包括將未標(biāo)記的數(shù)據(jù)組織到稱為聚類的集群中。因此,集群是類似數(shù)據(jù)項的集合。這里的主要目標(biāo)是發(fā)現(xiàn)數(shù)據(jù)點之間的相似性,并將相似的數(shù)據(jù)點分組到一個集群中。2)異常檢測是指識別與大部分數(shù)據(jù)有顯著差異的稀有項、事件或觀測值的方法。我們通常在數(shù)據(jù)中尋找異;虍惓V,因為它們是可疑的。異常檢測常用于銀行詐騙和醫(yī)療差錯檢測。無監(jiān)督學(xué)習(xí)算法的應(yīng)用無監(jiān)督學(xué)習(xí)算法的一些實際應(yīng)用包括:欺詐檢測惡意軟件檢測數(shù)據(jù)輸入過程中人為錯誤的識別進行精確的購物籃分析等你應(yīng)該怎么選擇監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)?在制造業(yè)中,哪種機器學(xué)習(xí)方法最適合給定的任務(wù)受著有許多因素的影響。而且,由于每個機器學(xué)習(xí)問題都是不同的,決定使用哪種技術(shù)是一個復(fù)雜的過程。一般來說,磨練正確機器學(xué)習(xí)方法的一個好策略是:評估數(shù)據(jù)。它有標(biāo)簽嗎?是否有專家知識支持附加標(biāo)簽?這將有助于確定是否應(yīng)使用有監(jiān)督、無監(jiān)督、半監(jiān)督或強化的學(xué)習(xí)方法明確目標(biāo)。這個問題是反復(fù)出現(xiàn)的嗎?或者,該算法是否有望預(yù)測新的問題?回顧在維數(shù)(特征、屬性或特征的數(shù)量)方面可能適合該問題的現(xiàn)有算法。候選算法應(yīng)該適合整個數(shù)據(jù)量及其結(jié)構(gòu)研究算法類型在相似問題中的成功應(yīng)用最后的話監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)是機器學(xué)習(xí)領(lǐng)域的關(guān)鍵概念。在學(xué)習(xí)不同的機器學(xué)習(xí)算法之前,對基礎(chǔ)知識的正確理解是非常重要的。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
-
8 每日AI全球觀察
- 1 特斯拉工人被故障機器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 AI 時代,阿里云想當(dāng)“安卓” ,那誰是“蘋果”?
- 4 拐點已至!匯川領(lǐng)跑工控、埃斯頓份額第一、新時達海爾賦能扭虧為盈
- 5 硬剛英偉達!華為發(fā)布全球最強算力超節(jié)點和集群
- 6 隱退4年后,張一鳴久違現(xiàn)身!互聯(lián)網(wǎng)大佬正集體殺回
- 7 L3自動駕駛延期,逼出車企技術(shù)自我淘汰
- 8 谷歌“香蕉”爆火啟示:國產(chǎn)垂類AI的危機還是轉(zhuǎn)機?
- 9 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進軍好萊塢
- 10 機器人9月大事件|3家國產(chǎn)機器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!