歸納推理

維基百科,自由的百科全書

歸納法歸納推理Inductive reasoning),有時叫做歸納邏輯,是論證的前提支持結論但不確保結論的推理過程[1]。它基於對特殊的代表(token)的有限觀察,把性質或關係歸結到類型;或基於對反覆再現的現象的模式(pattern)的有限觀察,公式表達規律。例如,使用歸納法在如下特殊的命題中:

  • 冰是冷的。
  • 彈子球在擊打球桿的時候移動。

推斷出普遍的命題如:

  • 所有冰都是冷的。
  • 所有彈子球都在擊打球桿的時候移動。

例子[編輯]

強歸納:

所有觀察到的烏鴉都是黑的。
所以所有烏鴉都是黑的。

這例示了歸納的本質:從特殊歸納出普遍。結論明顯不是確定的。除非我們見過所有的烏鴉 - 我們怎能都知道呢? - 可能還有些罕見的藍(烏)鴉或是白(烏)鴉。

弱歸納:

我總是把畫像掛在釘子上。
所以所有畫像都是掛在釘子上的。

在這個例子中,前提建立在確定事物之上: 「我總是把畫像掛在釘子上」,但是不是所有的人都把畫像掛在釘子上,而那些確實使用釘子的人也可能只是有時使用。有很多物體可以用來掛畫像,包括但不限於:螺絲釘、螺栓和夾子。我做的結論是過度普遍化,並在某些情況下是錯的。

少年們得到了許多超速罰單。
所以所有少年都超速。

在這個例子中,基礎前提不是建立在確定事物之上:不是所有我發現超速的少年得到了罰單。這可能在於少年要超速的普遍本質 - 同烏鴉是黑的一樣 - 但是前提所基於的更像痴心妄想而不是直接的觀察。

有效性[編輯]

多數人學習的形式邏輯是演繹的,而歸納推理則是屬於非形式邏輯。雖然如此,但一些哲學家仍堅持建立歸納邏輯的系統,但是對歸納的邏輯是否可能是有爭議的。相對於演繹推理,歸納推理達成的結論並非必然與最初的假定有相同的確定程度。例如,所有天鵝都是白色的結論明顯是錯的,但在殖民澳大利亞之前在歐洲一直被認為是正確的。歸納論證從來就不是有約束力的但它們可以是有說服力的。歸納推理在演繹上是無效的。(在形式邏輯中的論證是有效的,若且唯若論證的前提為真而結論卻為假是不可能的。)

在歸納法中,總是有很多結論可以合理的關聯於特定前提。歸納是開放的;而演繹是封閉的。

歸納問題的經典哲學處理,意味著為歸納推理找到了正當理由,是蘇格蘭人大衛·休謨完成的。休謨突出了依據重複經驗的模式的我們的日常推理,而不是演繹上的有效論證。比如我們相信麵包對我們有益,因為過去一直如此,但是麵包將來對我們有害至少是可以想像的。

休謨說對所有事情都堅持可靠的演繹上的正當有理的人會餓死的。替代激進懷疑論關於所有事物的無所作為,他提倡基於常識的實用懷疑論,這裡接受歸納法是必然的。

二十世紀的開發者很不同的為歸納問題加了外框。勝過選擇對將來做什麼預測,它可以被看作是選擇適合於觀察的概念(參見條目藍綠色)或適合於觀測數據點的曲線圖。

歸納法有時被加邊框為關於從過去做關於將來的推理,但是在最廣泛的意義上它涵蓋了在已觀察的事物的基礎上達成對未觀察的事物的結論。從現在的證據推論過去(比如考古)也算做歸納法。歸納法也可以跨越空間而不是時間,比如從在我們的星系得出關於整個宇宙的結論,基於本地經濟業績得出關於國家經濟政策的結論。

歸納推理的類型[編輯]

普遍化
普遍化或歸納普遍化,是從關於樣本的前提到關於總體的結論的過程。
  1. 比例為Q的樣本有性質A。
  2. 結論:比例為Q的全體有性質A。

前提提供給結論的支持依賴於樣本群體中的個體數目可比較於全體中的成員的數目,和樣本的隨機性。草率普遍化抽樣偏差以偏概全)是與普遍化有關的謬誤。

統計三段論
統計三段論是從一個普遍化到關於一個個體的結論的過程。
  1. 比例為Q的總體P有性質A。
  2. 個體I是P的成員。
  3. 結論:個體I有性質A的概率相當於Q。

在前提1中比例可以是像'3/5'、'所有的'或'一些'這樣的詞。兩個dicto simpliciter謬論可以出現在統計三段論中。它們是"意外"和"反意外"。

簡單歸納
簡單歸納是從關於一個樣本群體到關於另一個個體的結論的過程。
  1. 全體P的比例為Q的已知實例有性質A。
  2. 個體I是P的另一個成員。
  3. 結論:個體I有性質A的概率相當於Q。

這實際上是普遍化和統計三段論的組合,這裡的普遍化的結論也是統計三段論的第一個前提。

類推論證
(歸納的)類推是從已知的在兩個事物之間的類似性到關於在這兩個事物之間公共的一個額外性質的結論的過程:
  1. 事物P類似於事物Q。
  2. 事物P有性質A。
  3. 結論:事物Q有性質A。

類推依賴於已知共享的性質(類似性)蘊涵A也是共享的性質的推論。前提提供給結論的支持依賴於相干性和在P和Q的類似性。

因果推斷:因果推斷基於效果發生的條件得出關於因果關聯的結論。

關於兩個事物的相關性的前提可以指示在它們之間的因果聯繫,但是必須鞏固上額外的因素來建立因果聯繫的精確形式。

預測:預測從過去的樣本得出關於將來的個體的結論。
  1. 群體G的比例為Q的觀測過的成員有性質A。
  2. 群體G的下一個觀測的成員有性質A的概率相當於Q。
訴諸權威(典據論證)
引經據典論證基於來源說真命題的比例得出關於一個陳述的真實性的結論。它與推測有相同的形式。
  1. 權威A的比例為Q的主張是對的。
  2. 權威A的這個主張是對的概率相當於Q。

例子:

來自關於邏輯的網站的所有的評述都是對的。
這個信息來自關於邏輯的網站。
所以,這個信息(可能)是對的。

似真推理[編輯]

貝葉斯推理[編輯]

歸納邏輯的候選系統中,最有影響的是貝葉斯主義,它使用概率論作為歸納的框架。貝葉斯定理被用於在給定某些證據時計算你對一個假設的信任的強度應當改變多少。

關於從何得知最初的可信度是有爭議的。客觀貝葉斯主義者尋求對於假設為正確的概率的客觀評估,而因此不能倖免於客觀主義的哲學批判。主觀貝葉斯主義者堅持表示主觀可信度的先驗概率,但是貝葉斯定理的反覆應用導致了同後驗概率的高度一致性。因此它們不能為在衝突的假設間做出選擇提供客觀標準。可以用這種理論理性的證明對某些假設的相信是正當的,但是要付出拒絕客觀主義的代價。比如,不能使用這種方案在衝突的科學範例之間做客觀決定。[來源請求]

Edwin Jaynes是率直的物理學家和貝葉斯主義者,他聲稱'主觀'因素在所有推理中都存在(比如為演繹推理選擇公理,選擇最初的可信度或先驗概率,選擇可能度),並為來自定性知識的事物指派概率提出一系列的原理。最大熵不關心原理的推廣)和變換群組是他建立的兩個結果工具;二者都嘗試通過把知識比如條件的對稱性轉換成對概率分布的明確選擇,減輕在特定條件下概率指派的主觀性。

貝葉斯主義者感覺有資格稱它們的系統為歸納邏輯,由於Cox定理可以從在歸納推理系統上的約束推導出概率。


基本的貝葉斯推理可以作如下理解:

假設 α 為"法官判斷案件的正確性",其值可以是0至1的有理數

α ∈ {0..1} = "Correctness of Judgment",  where
→ < 0.5 代表判斷不正確
→ > 0.5 代表判斷正確
→ = 1 代表判斷完全正確
→ = 0 代表判斷完全錯誤

假設 β¹ 為"法官的安全性",其值可以是0至1的有理數

β¹ ∈ {0..1} = "Safty of Justice",  where
→ < 0.5 代表不安全
→ > 0.5 代表安全
→ = 1 代表判斷完全安全
→ = 0 代表判斷完全危險

設 A 為 α > 0.75 的事件, B 為 β¹ = 0 的事件

那麼"法官在危險狀態下判斷大致正確"的機會率就是 P(A|B)

Probability of In-danger-fair-correct-judgment of justice
= P(A|B) = P(α > 0.75 | β¹ =0)

使用貝葉斯推理,機會率 P(A|B) 可以以如下方法求解:


如果在判決當時,地方局勢非常危險,P(B) = P(β¹ = 0) 會大過 0.8

P(B) = 0.8

而根據以往判決,經裁決後,10個案件中有6.5個案件敗方認為裁決不公平,而選擇上訴

邏輯: 
      案件判決正確 ⇒ 就不會上訴
所以:
      選擇上訴 ⇒ 判決不正確
      P(A) = 0.65

因為地方局勢不安全,法官如果判決正確,而身陷險境的機會率超過 30% (主觀)

P(B|A) = 0.3

所以 "法官在危險狀態下判斷大致正確"的機會率就是

Probability of In-danger-fair-correct-judgment of justice

所以,根據貝納斯推論,如果地方局勢非常危險,法官的裁決只有 24.375% 大致正確。

再想深一層,

設 γ 為案件停留的日子

γ ∈ {1,2,3,...} 

再設 C 為案件停留超過18個月的事件 ≈ C = γ > 545 的事件

已知 案件通常審判 6個月,較多情況在150日至210日中間,在過往十年1000個C類案件中只有20件

γ ~ Gaussian Distribution with mean=180, variance=30
γ ~ N(180,30)

所以,可以相信,P(C) = P(γ > 545) < 0.005

without loss of generality, we can assume:
  P(C) = 0.005

設 β² 為"地方局勢的危險性",其值可以是0至1的有理數

β² ∈ {0..1} = "Country Safty",  where
→ < 0.5 代表不安全
→ > 0.5 代表安全
→ = 1 代表判斷完全安全
→ = 0 代表判斷完全危險

再設 D 為 β² > 0.8的事件

而以現在的局勢來看,失業率維持在3%

可以相信,P(D) > 97%

without loss of generality, we can assume:
  P(D) = 0.97

那麼,在地方局勢安全的情況下,案件停留超過 545日的機會率是多少呢?

這也可以用貝納斯推論求解:


根據常識統計,我們知道案件停留超過545日又地方局勢很危險的情況 20單案件裏面有 10件案件

邏輯: 
      案件通常審判 6個月,較多情況在 150日至210日中間
      γ ~ N(180,30)
      裁決正常 ⇒ 案件不會停留超過545日
所以,可以相信:
      P(D|C) = 0.5

所以,


根據貝納斯推論,在地方局勢安全的情況下,案件停留超過 545日的機會率只有 0.258%

⇒ 所以,如果案件真的停留超過 545日,而失業率維持在3% (代表地方局勢安全),這代表 "裁決無理" Irrational Judgement 的機會率是 93.75%

⇒ 經推論,裁決很大機會是無理 Irrational

⇒ 或者,有可能,你會爭議裁決真的不是無理,有40%以上是合理。但根據貝納斯理論,要 P(C|D) = 0.4,除非"地方局勢安全性"在 0.0025/0.4 = 0.00625,失業率高過99%。這是沒有可能的,所以根據逆反式,裁決不可能有40%以上是合理。


而貝納斯的理論中,有一個連環規則(Chain Rule)的

P(T|s,c) = P(s|T) P(T|c)

假設,現在我們想知道 P(A|C,D) = 想知道 P(C|A) P(A|D)

P(A|D) = P(D|A) x P(A) / P(D) = P(D|A) 0.65 / 0.97  
P(C|A) = P(A|C) x P(C) / P(A) = P(A|C) 0.005 / 0.65
P(A|C,D) = P(D|A) x P(A|C) x 0.005 / 0.97

 因為根據現實,地方安全基本上和裁決無太大關係,而現在地方大致安全。所以,without loss of generality,可設:
    P(D|A) = 0.9 
 而停留超過 545日而有裁決正確的案件的機會率只是一半一半。所以,without loss of generality,可設:
    P(C|A) = 0.5

所以

 P(A|C,D) = 0.9 x 0.5 x 0.005 / 0.97 = 0.00232

換句話說,

⇒ 在安全的情況下,案件停留超過 545日,而裁判正確的機會率是 0.232% (p-value)

⇒ 幾乎是沒有可能

實際例子[編輯]

一件由A和B同時發生才能確立的事件C,明顯地你會觀察到:事件C成立則B必定發生。但絕對不能貿然將結論誤解為"只要B發生則事件C一定發生"(而應該是要由A和B同時發生才能確定C的產生)。而且你也不能擅自擴充成為"只要C事件不發生則事件B一定沒有發生",同樣的關鍵點仍舊是"當A不成立時,C就一定不成立"而B是否成立就不一定也無從得知了。

事實上你只能由現有實驗結果推論,尤其是生物體的實驗更不易有完美相同條件的控制組,及顧及全方面的對照組,你也無從判定究竟一共要有幾個因素加起來才會導致你在觀察的結果。更常見的情況是,你因為總是同時觀察到了C跟D現象,就因此加以歸納為A+B會導致C+D,或是A+B+D會導致C的結論。在你做更進一步的實驗來確認你的假設之前,你都無法排除這些不確定性,更誇張的就是C跟D說不定根本就沒有關係,或是更複雜的要有D+E才有A,又要同時有B,才有C這個結果。所以,在科學實驗中,演繹法才是比較不容易被質疑的一種判斷法,但是也不一定保證這樣做出的結論就是對的。

參見[編輯]

參考文獻[編輯]

  1. ^ 歸納推理. 教育百科. 台灣: 中華民國教育部. [2023-04-01]. (原始內容存檔於2023-04-01) (中文(繁體)). 

外部連結[編輯]