機器學習

機器學習是人工智能的一個分支。人工智能的研究歷史有着一條從以「推理」為重點，到以「知識」為重點，再到以「學習」為重點的自然、清晰的脈絡。顯然，機器學習是實現人工智能的一個途徑之一，即以機器學習為手段，解決人工智能中的部分問題。機器學習在近30多年已發展為一門多領域科際整合，涉及概率論、統計學、逼近論、凸分析、計算複雜性理論等多門學科。

機器學習理論主要是設計和分析一些讓計算機可以自動「學習」的算法。機器學習算法是一類從數據中自動分析獲得規律，並利用規律對未知數據進行預測的算法。因為學習算法中涉及了大量的統計學理論，機器學習與推斷統計學聯繫尤為密切，也被稱為統計學習理論。算法設計方面，機器學習理論關注可以實現的，行之有效的學習算法（要防止錯誤累積）。很多推論問題屬於非程序化決策，所以部分的機器學習研究是開發容易處理的近似算法。

機器學習已廣泛應用於數據挖掘、計算機視覺、自然語言處理、生物特徵識別、搜索引擎、醫學診斷、檢測信用卡欺詐（英語：Credit card fraud）、證券市場分析、DNA序列測序、語音和手寫識別、遊戲和機器人等領域。

定義

機器學習有下面幾種定義：

機器學習是一門人工智能的科學，該領域的主要研究對象是人工智能，特別是如何在經驗學習中改善具體算法的性能。
機器學習是對能通過經驗自動改進的計算機算法的研究。
機器學習是用數據或以往的經驗，以此優化計算機程序的性能標準。

電腦科學家Tom M. Mitchell（英語：Tom M. Mitchell）在其著作的Machine Learning一書中定義的機器學習為：A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.^[1]

分類

機器學習可以分成下面幾種類別：

監督學習從給定的訓練數據集中學習出一個函數，當新的數據到來時，可以根據這個函數預測結果。監督學習的訓練集要求是包括輸入和輸出，也可以說是特徵和目標。訓練集中的目標是由人標註的。常見的監督學習算法包括回歸分析和統計分類。

監督學習和非監督學習的差別就是訓練集目標是否有人為標註。他們都有訓練集且都有輸入和輸出

無監督學習與監督學習相比，訓練集沒有人為標註的結果。常見的無監督學習算法有生成對抗網絡（GAN）、聚類。
半監督學習介於監督學習與無監督學習之間。
增強學習機器為了達成目標，隨着環境的變動，而逐步調整其行為，並評估每一個行動之後所到的回饋是正向的或負向的。^[2]

算法

具體的機器學習算法有：

構造間隔理論分布：聚類分析和模式識別
構造條件概率：回歸分析和統計分類
通過再生模型構造概率密度函數：
- 最大期望算法
- 概率圖模型：包括貝氏網路和Markov隨機場
- Generative Topographic Mapping
近似推斷技術：
最優化：大多數以上方法，直接或者間接使用最優化算法。
量子機器學習

軟件

包含各種機器學習演算法的軟體套裝包括：

免費開源軟件

Python軟件庫及框架

參考文獻

引用

^ Tom M. Mitchell. Machine Learning. McGraw-Hill. 1997年3月: 第2頁. ISBN 0070428077 （英語）.
^ 林東清. 资讯管理：e化企业的核心竞争能力七版. 台北市: 智勝文化. 2018年8月: 第118頁. ISBN 9789864570478 （中文）.

來源

書籍

Bishop, C. M. (1995). 《模式識別神經網絡》，牛津大學出版社. ISBN 0-19-853864-2.
Bishop, C. M. (2006). 《模式識別與機器學習》，Springer. ISBN 978-0-387-31073-2.
Richard O. Duda, Peter E. Hart, David G. Stork (2001). 《模式分類》（第2版）, New York: Wiley. ISBN 0-471-05669-3.
MacKay, D. J. C. (2003). 《信息理論、推理和學習算法》（頁面存檔備份，存於網際網路檔案館），劍橋大學出版社. ISBN 0-521-64298-1
Mitchel.l, T. (1997). 《機器學習》, McGraw Hill. ISBN 0-07-042807-7
Sholom Weiss, Casimir Kulikowski (1991). Computer Systems That Learn, Morgan Kaufmann. ISBN 1-55860-065-5.

外部連結

UCI description （頁面存檔備份，存於網際網路檔案館）
機器學習軟件Weka （頁面存檔備份，存於網際網路檔案館）
Pablo Castro主頁（頁面存檔備份，存於網際網路檔案館）
機器學習網郵件列表（頁面存檔備份，存於網際網路檔案館）
機器學習和自然語言處理-弗萊堡大學（頁面存檔備份，存於網際網路檔案館）
機器學習和數據挖掘，生物信息學小組，慕尼黑工業大學
機器學習和生物計算-Bristol大學（頁面存檔備份，存於網際網路檔案館）
機器學習和應用統計學@微軟研究
機器學習研究月刊（頁面存檔備份，存於網際網路檔案館）
機器學習期刊（頁面存檔備份，存於網際網路檔案館）
機器學習-Kmining，數據挖掘和KDD科學參考（頁面存檔備份，存於網際網路檔案館）
Book "智能系統社區" by Walter Fritz
開放目錄項目（頁面存檔備份，存於網際網路檔案館）
機器學習論文-CiteSeer （頁面存檔備份，存於網際網路檔案館）
Orange，使用Python腳本語言的機器學習組件和可視化編程接口（頁面存檔備份，存於網際網路檔案館）

參見

[1] Tom M. Mitchell. Machine Learning. McGraw-Hill. 1997年3月: 第2頁. ISBN 0070428077 （英語）.

[2] 林東清. 资讯管理：e化企业的核心竞争能力七版. 台北市: 智勝文化. 2018年8月: 第118頁. ISBN 9789864570478 （中文）.

[1]

[2]