機器學習
此條目可參照英語維基百科相應條目來擴充。 |
機器學習與資料探勘 |
---|
人工智能系列內容 |
---|
機器學習是人工智能的一個分支。人工智能的研究歷史有着一條從以「推理」為重點,到以「知識」為重點,再到以「學習」為重點的自然、清晰的脈絡。顯然,機器學習是實現人工智能的一個途徑之一,即以機器學習為手段,解決人工智能中的部分問題。機器學習在近30多年已發展為一門多領域科際整合,涉及概率論、統計學、逼近論、凸分析、計算複雜性理論等多門學科。
機器學習理論主要是設計和分析一些讓計算機可以自動「學習」的算法。機器學習算法是一類從數據中自動分析獲得規律,並利用規律對未知數據進行預測的算法。因為學習算法中涉及了大量的統計學理論,機器學習與推斷統計學聯繫尤為密切,也被稱為統計學習理論。算法設計方面,機器學習理論關注可以實現的,行之有效的學習算法(要防止錯誤累積)。很多推論問題屬於非程序化決策,所以部分的機器學習研究是開發容易處理的近似算法。
機器學習已廣泛應用於數據挖掘、計算機視覺、自然語言處理、生物特徵識別、搜索引擎、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、遊戲和機器人等領域。
定義
[編輯]機器學習有下面幾種定義:
- 機器學習是一門人工智能的科學,該領域的主要研究對象是人工智能,特別是如何在經驗學習中改善具體算法的性能。
- 機器學習是對能通過經驗自動改進的計算機算法的研究。
- 機器學習是用數據或以往的經驗,以此優化計算機程序的性能標準。
電腦科學家Tom M. Mitchell在其著作的Machine Learning一書中定義的機器學習為:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.[1]
分類
[編輯]機器學習可以分成下面幾種類別:
- 監督學習從給定的訓練數據集中學習出一個函數,當新的數據到來時,可以根據這個函數預測結果。監督學習的訓練集要求是包括輸入和輸出,也可以說是特徵和目標。訓練集中的目標是由人標註的。常見的監督學習算法包括回歸分析和統計分類。
監督學習和非監督學習的差別就是訓練集目標是否有人為標註。他們都有訓練集 且都有輸入和輸出
- 無監督學習與監督學習相比,訓練集沒有人為標註的結果。常見的無監督學習算法有生成對抗網絡(GAN)、聚類。
- 半監督學習介於監督學習與無監督學習之間。
- 增強學習機器為了達成目標,隨着環境的變動,而逐步調整其行為,並評估每一個行動之後所到的回饋是正向的或負向的。[2]
算法
[編輯]具體的機器學習算法有:
軟件
[編輯]包含各種機器學習演算法的軟體套裝包括:
免費開源軟件
[編輯]Python軟件庫及框架
[編輯]參考文獻
[編輯]引用
[編輯]- ^ Tom M. Mitchell. Machine Learning. McGraw-Hill. 1997年3月: 第2頁. ISBN 0070428077 (英語).
- ^ 林東清. 资讯管理:e化企业的核心竞争能力 七版. 台北市: 智勝文化. 2018年8月: 第118頁. ISBN 9789864570478 (中文).
來源
[編輯]- 書籍
- Bishop, C. M. (1995). 《模式識別神經網絡》,牛津大學出版社. ISBN 0-19-853864-2.
- Bishop, C. M. (2006). 《模式識別與機器學習》,Springer. ISBN 978-0-387-31073-2.
- Richard O. Duda, Peter E. Hart, David G. Stork (2001). 《模式分類》(第2版), New York: Wiley. ISBN 0-471-05669-3.
- MacKay, D. J. C. (2003). 《信息理論、推理和學習算法》 (頁面存檔備份,存於網際網路檔案館),劍橋大學出版社. ISBN 0-521-64298-1
- Mitchel.l, T. (1997). 《機器學習》, McGraw Hill. ISBN 0-07-042807-7
- Sholom Weiss, Casimir Kulikowski (1991). Computer Systems That Learn, Morgan Kaufmann. ISBN 1-55860-065-5.
外部連結
[編輯]- UCI description (頁面存檔備份,存於網際網路檔案館)
- 機器學習軟件Weka (頁面存檔備份,存於網際網路檔案館)
- Pablo Castro主頁 (頁面存檔備份,存於網際網路檔案館)
- 機器學習網郵件列表 (頁面存檔備份,存於網際網路檔案館)
- 機器學習和自然語言處理-弗萊堡大學 (頁面存檔備份,存於網際網路檔案館)
- 機器學習和數據挖掘,生物信息學小組,慕尼黑工業大學
- 機器學習和生物計算-Bristol大學 (頁面存檔備份,存於網際網路檔案館)
- 機器學習和應用統計學@微軟研究
- 機器學習研究月刊 (頁面存檔備份,存於網際網路檔案館)
- 機器學習期刊 (頁面存檔備份,存於網際網路檔案館)
- 機器學習-Kmining,數據挖掘和KDD科學參考 (頁面存檔備份,存於網際網路檔案館)
- Book "智能系統社區" by Walter Fritz
- 開放目錄項目 (頁面存檔備份,存於網際網路檔案館)
- 機器學習論文-CiteSeer (頁面存檔備份,存於網際網路檔案館)
- Orange,使用Python腳本語言的機器學習組件和可視化編程接口 (頁面存檔備份,存於網際網路檔案館)