機器學習 是人工智能 的一個分支。人工智能的研究歷史有着一條從以「推理 」為重點,到以「知識 」為重點,再到以「學習 」為重點的自然、清晰的脈絡。顯然,機器學習是實現人工智能的一個途徑之一,即以機器學習為手段,解決人工智能中的部分問題。機器學習在近30多年已發展為一門多領域科際整合 ,涉及概率論 、統計學 、逼近論 、凸分析 、計算複雜性理論 等多門學科。
機器學習理論主要是設計和分析一些讓計算機 可以自動「學習 」的算法 。機器學習算法是一類從數據 中自動分析獲得規律 ,並利用規律對未知數據進行預測的算法。因為學習算法中涉及了大量的統計學理論,機器學習與推斷統計學 聯繫尤為密切,也被稱為統計學習理論 。算法設計方面,機器學習理論關注可以實現的,行之有效的學習算法(要防止錯誤累積)。很多推論 問題屬於非程序化決策 ,所以部分的機器學習研究是開發容易處理的近似算法。
機器學習已廣泛應用於數據挖掘 、計算機視覺 、自然語言處理 、生物特徵識別 、搜索引擎 、醫學診斷 、檢測信用卡欺詐 、證券市場 分析、DNA序列 測序、語音 和手寫 識別、遊戲 和機器人 等領域。
機器學習有下面幾種定義:
機器學習是一門人工智能的科學,該領域的主要研究對象是人工智能,特別是如何在經驗學習中改善具體算法的性能。
機器學習是對能通過經驗自動改進的計算機算法的研究。
機器學習是用數據或以往的經驗,以此優化計算機程序的性能標準。
電腦科學家Tom M. Mitchell 在其著作的Machine Learning一書中定義的機器學習為:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.[1]
機器學習可以分成下面幾種類別:
監督學習 從給定的訓練數據集中學習出一個函數,當新的數據到來時,可以根據這個函數預測結果。監督學習的訓練集要求是包括輸入和輸出,也可以說是特徵和目標。訓練集中的目標是由人標註的。常見的監督學習算法包括回歸分析 和統計分類 。
監督學習和非監督學習的差別就是訓練集目標是否有人為標註。他們都有訓練集 且都有輸入和輸出
無監督學習 與監督學習相比,訓練集沒有人為標註的結果。常見的無監督學習算法有生成對抗網絡 (GAN)、聚類 。
半監督學習 介於監督學習與無監督學習之間。
增強學習 機器為了達成目標,隨着環境的變動,而逐步調整其行為,並評估每一個行動之後所到的回饋是正向的或負向的。[2]
具體的機器學習算法有:
參考文獻 [ 編輯 ]
書籍
Bishop, C. M. (1995). 《模式識別神經網絡》,牛津大學出版社. ISBN 0-19-853864-2 .
Bishop, C. M. (2006). 《模式識別與機器學習》,Springer. ISBN 978-0-387-31073-2 .
Richard O. Duda, Peter E. Hart, David G. Stork (2001). 《模式分類》(第2版), New York: Wiley. ISBN 0-471-05669-3 .
MacKay, D. J. C. (2003). 《信息理論、推理和學習算法》 (頁面存檔備份 ,存於網際網路檔案館 ),劍橋大學出版社. ISBN 0-521-64298-1
Mitchel.l, T. (1997). 《機器學習》, McGraw Hill. ISBN 0-07-042807-7
Sholom Weiss, Casimir Kulikowski (1991). Computer Systems That Learn , Morgan Kaufmann. ISBN 1-55860-065-5 .
外部連結 [ 編輯 ]
可微分計算
概論 概念 應用 硬件 軟件庫 實現
人物 組織 架構
主題
分類