最大简约法

最大简约法（英语：Maximum parsimony）是一种常使用于系统发生学计算的方式，可用来根据分子序列的变异程度，来分析生物之间的演化关系，进而建构出演化树。

“简约”一般有“经济的”或“俭省的”之义，但在生物学中，“简约法”是属于非参数统计的一种统计方法以估计亲缘关系。以最大简约法建构的亲缘关系树是以演化过程具有最少次变化为前提，表示现存资料在过去的演化过程应由最少次步骤所形成。这项概念由Walter M. Fitch在1971年所提出。^[1].

虽然演化过程并非必定由最少次步骤所形成，但普遍上认为较简约的步骤比起较繁复的步骤在演化过程中更容易发生。因此，“简约”的概念仍是建构亲缘关系的重要标准。^[2]

在最大简约法的概念下，所需变化次数最少的一棵演化树是最好的结果。不过由于趋同演化现象的存在，最大简约法有时会使得原本不同起源的生物被归为相近生物。一般而言，最大简约法较利于分析物种间关系较近时的情况。

发展历史[编辑]

于1950年代，电子计算机开始在学术界间流行，使得生物学家有机会利用电子计算机分析资料量庞大的系统发生学问题。于1957年，两位昆虫学家，Charles D. Michener与Robert R. Sokal，所发发表的论文中以数学的角度讨论如何对不同类别的生物进行分类学工作，并跨及系统发生学的概念。^[3]随后，Robert R. Sokal与Peter H. A. Sneath在1963年出版的著作《Principles of Numerical Taxonomy》中报导了多项分类学在数学上的分析方法及实例，并提出分类学应以系统发生学为基础的概念。该著作亦被数学家、统计学家及精神测定学家视为重要学术基础。在同一时代，分子生物学在方法上亦有重要发展，例如测定蛋白质序列，而提供了系统发生学者崭新的分析材料来源。

于1963年，Luigi L. Cavalli-Sforza与Anthony W. F. Edwards在研讨会中首次以“parsimony”的字眼描述他们用来分析人类中不同族群的亲缘关系，并在1965年的出版文章中以该亲缘分析的结果绘制成人类不同族群的基因型在世界地图上分化的路径。^[4]^[5]然而，这些文章虽引出简约法的概念，并没有提出简约法的演算方式。

Joseph Camin与Robert R. Sokal于1965年发表的文章中首次报导基于简约法的算法。^[6]在这篇文章中，作者们明确指出简约法的意涵：

“

……我们提出此研究方法的正确性的依据是：大自然确实是以简约为前提……（... the correctness of our approach depends on the assumption that nature is, indeed, parsimounious,...）

”

随后，Roland Bartcher于1966年以FORTRAN编程语言实作了此算法。^[7]至1966年，R. V. Eck与M. O. Dayhoff的著作中报导了针对蛋白质的氨基酸序列为对象的简约法算法。^[8]。

简约法的概念及其算法虽然在1957至1966年被多位学者提出，但造成普及是源自Walter M. Fitch与Emanuel Margoliash在1967年所发表的文章。^[9]该文章中引入了权重及分子时钟的概念。随后，Walter M. Fitch发表了针对DNA序列的算法，成为最著名的算法。^[2]

理论背景[编辑]

简约法利用系统发生学上的离散资料作为特征所构成的矩阵估计一个或多个最佳的系统发生树，而这些资料来源可能是有遗传关系的多个物种或多个族群，之后最大简约法在可能的亲缘树中挑选需最少步骤可形成者，视为最佳的亲缘关系树。最大简约法可使用于分析大多数的系统发生资料，但在近年由于其它方法的兴起，目前较常使用于形态资料而非核酸或蛋白质与分子序列资料。

估计系统发生树并不是一件简单的事。在给定一群分类群之后则可产生非常多种系统发生树，例如，10个物种按排列可以构成超过2,000,000种无根树。在诸多可能的亲缘树中，必须借由特定标准以选出与资料最相符者。然而，资料往往并不能由简单的算法所分析。理想上预期某个演化特征（例如表型或等位基因）在演化中势必经历呈由一分二、由二分四的过程，所以可以推论共享有相同特征的分类群之亲缘关系较相近，而与不具有此特征的分类群之亲缘关系较远（在该特征并不存在于共同祖先的前提下；即Symplesiomorphy（英语：Symplesiomorphy））。在这个概念下，我们可以预期蝙蝠与猴的亲缘关系较近而蝙蝠与鱼则较远，因为蝙蝠与猴共享有体毛的相同特征。然而，我们并不能说蝙蝠与猴的亲缘关系较近而蝙蝠与鲸鱼则较远，因为我们以三者的共同祖先具有体毛特征为前提。

然而，演化过程有诸多现象，包括趋同演化、平行演化与祖征重现（evolutionary reversal），也就是多个非同源物种发生相同特征（homoplasy）的现象，使得以上述概念估计亲缘关系树时发生偏差。由于诸多原因，二个物种可能发生相同特征但并非源自于他们的共同祖先。假如我们视这项相同特征为二物种关系相近的证据，则会重建一个错误的亲缘关系树。此外，具有趋同特征的亲缘资料可能因取用不同部分资料进行分析而估计出结果非常不同的亲缘关系树。因此，估计亲缘关系树的方法必须借由选取最符合所有资料的亲缘关系树以解决上述冲突（即使有少部分资料仍支持错误结论）。简约法常被错误地以“趋同并不常发生”为前题。事实上，趋同演化所产生的特征在最大简约法上仍有分析价值，而普遍存在的趋同特征并不能系统性地影响以简约法为基础的分析结果。 ^[10]

与亲缘关系树不相符的资料并不能简单地视为“噪声”，而可能在亲缘关系树的某些部分提供了亲缘关系之讯号。在上述蝙蝠、猴与鲸鱼的例子中，不具有体毛特征的鲸鱼反应出哺乳动物始祖可能不具有体毛（即homoplastic）。这暗示着体毛这项特征可能在蝙蝠与猴的共同祖先发生，但鲸鱼的祖先早在体毛特征发生之前即分化至其它支系。然而，鲸目的物种在演化史上确实失去体毛而非直接继承自无体毛的祖先。究竟如何决定最佳的亲缘关系树，包括找出与亲缘关系树不相符的资料，是一项复杂的过程。最大简约法即是被设计成解决这项困难的研究方法。

特征资料[编辑]

最大简约法所需要输入的资料是多个分类群或族群的“特征”。虽然对亲缘特征并没有绝对的定义，但实务上常以某项属性作为特征，例如动物的体长。属性可以是与形态、分子、遗传、生理或动物行为学相关的，但以能够呈现遗传变异为原则。至于选用的属性是否可被直接遗传（如基因）或被间接遗传（如动物行为学）则尚无定论。

每一项特征必须被分类为离散的变数，称为特症状态。特症状态经常以描述词呈现，例如“眼睛颜色”这项特征的特症状态可以是“蓝色”及“棕色”等描述词。特征可以具有二种以上的状态。仅具有一种状态的特征因为缺乏呈现变异的资讯，所以在最大简约法并没有功用且常被事先排除。

对特征赋予某个状态在系统发生分析上并不是绝对科学的，并且常常具有争议。例如在上述眼睛颜色的例子中，如何明确地赋予某个体具有“淡褐色”眼睛的特症状态是不确定的：应分类作淡褐色、绿色或蓝色？在通常情况下，相似特征被赋予相同的特症状态，所以可以将淡褐色与绿色赋予相同状态（因为二者皆为浅色），或是采用更多的状态来同时描述同一个特征。由此可知，对特征赋予某个状态可能模凌两可而存在争议。

这些模凌两可的特症状态是造成使用特征资料进行系统分类分析发生错误的主要原因。在上述眼睛颜色的例子中，“有无眼睛”也是一个可能的特征，但不具有眼睛的个体即无法被赋予“眼睛颜色”的状态而造成空缺值。在这种情况下，实务上使用“?”、“X”或“-”等符号以表示未知的特症状态。目前最大简约法将这些未知的特症状态的发生原因一律视为“对分析不具特定效果”，也就是说，分析过程对于某个“?”资料视为基于最大简约下最可能的某一项状态。

遗传资料，例如核酸或蛋白质序列，对这些基于特征的系统分析方法（包括最大概似法）是合适的，因为核酸或蛋白质序列本身即为离散资料。例如在核酸序列中，特定位点只可能是腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶、尿嘧啶或排比后的序列空缺（常记为“-”）；例如在蛋白质序列中，每一个位点必为一个基本氨基酸或序列空缺。在这些情况下，对特征赋予某个状态几乎没有模凌两可的可能情形，除非定序方法无法明确显示何种状态或序列排比存在争议。序列空缺有时也被视为一种特征，不过应对它赋予如何状态则尚无共识。

无序与有序特征[编辑]

特征可以是无序或有序的。对二元特征（如有或无）而言，无序或有序没太大差别。对多状态特征而言，无序特征可被视为“差异皆相等”，即在演化上状态间转换所需步骤数完全相同且不存在或不需要任何过渡状态。对多状态的有序特征而言，状态间转换需要特定的过程且需要存在过渡状态。换句话说，不同特定状态间转换所需要的步骤是不同的。如上述眼睛颜色的例子，若以无序特征考量眼睛颜色这项特征，则眼睛颜色在四种颜色间的转换是相同距离的；若以有序特征考量眼睛颜色特征，则可能有“棕—浅褐—绿—蓝”的顺序，使得由棕色转变至绿色有2个步骤而由棕色转变至蓝色有3个步骤，且浅褐色是棕色转变至绿色的过渡状态。

对有序特征赋予状态是否有效或适当是存在争议的。当状态的顺序存在明显逻级、状态的顺序可在个体发生学上验证、或存在演化过程的明显趋势时，对有序特征赋予状态是相对容易的。然而，有些专家拒绝对采用有序特征，因为有序特征乃基于不可能完全被验证的演化历史。

特征或状态的权重[编辑]

特征是可以被赋予不同的权重，使得在方法上认定某些特征与真正的演化过程有较大或较小的关联性。我们可以对在演化上容易反映演化历史的特征给予较大的权重而使该特征转换时需要更多的步骤。过去对特征赋予不同的权重有许多讨论。目前大多数人采用权重全相等（即放弃权重）的方式进行分析，但仍采用权重的情况仍十分常见。例如，等位基因频率资料常是比例资料且被设定为低权重的有序资料。又例如核酸序列中的第三位碱基由于多不影响对特定氨基酸的配对，所以容易形成中性的变异，故应给予较低的权重以免对估计真实的系统发生树造成干扰。

除了特征间可赋予不同权重，同特征内的不同状态亦可赋予不同的权重。这种情况常发生在核酸序列资料上，因为核酸转换几率并非全然相等。某些核酸转换的几率较低（例如A-C、A-T、G-C、G-T等）故可赋予较高的权重以表示需较多的步骤方可产生这些变化。

未知状态[编辑]

有些系统发生学者偏好保留大量的未知状态（以“?”符号记）以表示无法得知状态、怀疑状态的真实性、或是视该特征乃非同源物种的相同特征（homoplasy）。理论上与模拟研究已指出这种保留大量未知状态的方式并不能改善结果反而牺牲了分析的正确性。^{[来源请求]}

类群的抽样[编辑]

简约法分析（或任何亲缘树分析）所需要的时间与多少类群被纳入是呈比例关系的。此外，由于在分析中纳入较多的类群必增加亲缘关系树的分支，故纳入大量类群的分析将存在许多不确定性。由于收集资料有时间和金钱的限制，所以大多数的分析只采用某分类群内的部分可收集的子类群。事实上，某些学者主张仅纳入4个类群（产生有意义之无根树的最少类群数）即可达成一个正确的亲缘分析，而纳入越多的特征比纳入越多的类群更有价值。因此，纳入多少类群作为分析资料仍未有共识且存在争议。

无论以实务、理论及模拟的角度切入，已有许多研究指出纳入足够的类群具有高度重要性。这些研究大多数可总结一个现象：系统分析资料是一个特征数乘以类群数的矩阵，故增加一倍的类群数与增加一倍的特征数对该矩阵大小的贡献量是相同的。此外，增加一个类群即使每一个特征皆纳入一个新的样本，但更重要的是，这通常也纳入了特症状态的“组合”。这些特症状态的组合不仅可决定该类群应位于亲缘树的哪个分支，也可能因改变了对特征变化的估计而修正原本存在类群之间的亲缘关系。

简约法最大的弱点是容易产生长枝吸引效应（long-branch attraction），而这经常在取样的类群数不足之下发生（尤其是仅采用4个类群的情况下）。在这种情况下，仅借由增加纳入分析的特征数量并无法有效地增加分析结果的正确性。若新纳入分析的不是特征而是类群，则往往可以去除长支吸引效应（尤其是化石资料）并有效地增加估计特征在类群间的变化之正确性。由于目前已了解增加类群对分析具有重要的正向影响，采用数百个类群但仅纳入千计的特征仍可能产生正确性高的的分析结果。^{[来源请求]}

虽然许多研究已指出增加类群数的重要性，但如何选择采样的策略仍需要更多研究。由于电脑的运算能力不断进步以及定序的成本降低，有越来越多的亲缘分析纳入以百计的类群，且纳入的特征数也持续增加。

分析方法[编辑]

最大简约法的概念非常直接：对所有可能的亲缘关系树计算其简约程度（如特征转换的次数），并选取最简约的树（如特征转换的次数最少者）为最佳的亲缘关系树。

亲缘关系树的简约程度乃借由一个简单的算法推估演化过程中特征发生转变的“步骤”。所谓一个步骤是指某个特征的状态发生转变（即成为另一个状态）。在有序特征中，同一个特征内的状态发生变化可能包括多个步骤。无论如何，这些步骤的结果被视为可以解释现有资料的特征分布。简单来说，我们认为现有资料的特征是由演化过程中特征转变步骤的结果。按排列组合产生诸多不同树型的可能亲缘关系树，并以算法推估每种树型中最简约（即最少次状态转变）的特征转变历史。最终，在诸多可能的亲缘关系树之中，最大简约法所偏好的是具有最少步骤的亲缘关系树。

简约法分析基本上产生点估计，缺乏任何形式的信赖区间，这一点常被批评。已有几种方法可以用来评估支持度。

刀切法（页面存档备份，存于互联网档案馆）（Jackknifing）和自助法（Bootstrapping），为统计上重新抽样的步骤，已被应用于简约法分析。刀切法重新抽样的过程采取抽后不放回（即抽样对象最多只会被抽一次），抽样对象可以是特征或分类单元。但如果抽样对象为分类单元，之后的解释会很复杂，因为我们感兴趣的是树形，而比较包含不同分类单元的树的差异并不易懂。自助法采取抽后放回（即抽样对象可被多次抽取），抽样对象只有特征，因为加入重复的分类单元至数据中并不会改变简约法分析的结果。分析亲缘关系时，自助法很常被使用。这两种方法均可借由大量重复抽样的过程扰动原始数据。“自助百分比”（而非P值）用来评估支持度。

另一种估计支持度的方法为布雷默尔支持度（Bremer support），即衰退指数（decay index）（严格而言它并非一个指数）。其值常常很低（典型上为1或2步），但常和自助支百分比成比例。然而，衰退指数的值并不易懂，且常被反对自助法的作者接受（虽然许多型态系统分类学家，尤其是古生物学家，常常两种值皆发表）。

算法[编辑]

借由特定的算法可以估计特征转变在亲缘关系树上的过程，其中最著名的是由Walter M. Fitch所提出，但该算法仅适用于较少类群之分析。大规模类群须借由其它算法，以仅计算部分可产生最大简约程度之亲缘关系树的方式求解。

Fitch算法[编辑]

Fitch算法源自于Walter M. Fitch在1971年所提出的概念，其内容是根据每个特定的特征由现有二姊妹类群或支系之状态以交集的方式估计上游节点的可能状态；若该交集为空集合则以联集取代交集并累加简约分数。^[2]

Fitch算法可以一般化地表示成：在一个具有n个类群的亲缘关系树T中，某个特征c具有k个可能状态之，并将某节点v的状态记为c(v)，则对每个外部节点（即末端节点）的状态之集合

S(v) = {c(v)}

而对每个具有u及w子代节点的内部节点的状态之集合

S(v)={\begin{cases}S(u)\cap S(w),&S(u)\cap S(w)\neq \varnothing \\S(u)\cup S(w),&S(u)\cap S(w)=\varnothing \end{cases}}

在起初赋予简约分数z = 0，再逐一对每个节点v估计S(v)。每当

S(v)=S(u)\cap S(w)=\varnothing

则z := z + 1。在估计每个节点后，最终z即为该亲缘关系树发生状态转变的总次数。

适合大规模类群的算法[编辑]

当愈分析的类群规模很大时，简约法会遭遇到NP困难。下列为试图解决此问题的几种方法：

枝条捆扎法（Branch and Bound）: 由Hendy and Penny于1982年所提出。^[11]此算法考虑无根树，先将三个分类单元构成一棵无根树，计算需要几步才可以解释这棵树所有的位点。然后估计再增加一物种所需最少的改变次数。此估计值为增加新物种的所有位点改变的总和。在运算过程中，将保留估计值最小的树形。
最近邻交换（Nearest neighbor interchange, NNI）: 最近邻交换重新排列树形的方法为解散子树（subtree）的连接关系来形成不同的树形。利用爬山算法（hill-climbing algorithms），永远将最好的邻居移置一起，直到没有更好的邻居存在。
子树删除-再接法（Subtree pruning and regrafting, SPR）: 由Maddison于1991年所提出。^[12]将一子树从原始树上移除，再将子树插回原始树上其他的位置，以产生新的树形。
子树切断-重连法（Tree Bisection and Reconnection, TBR）: 将子树从母树的内节点（interior node）上拆除，然后尝试创造出所有可能将子树和母树的连接方法。这个方法常产生更多种连接的方法，故有更高的机会找到较好的树。

最大简约法在亲缘分析上的问题[编辑]

最大简约法是一种非常简单的方法，也因此使其被广为使用。然而，它并没有统计一致性（英语：Consistency_(statistics)）（statistically consistent）。也就是说，当给予足够的数据时，它不保证能产生具有高或然率的真正的树。一致性，这里指的是增加更多的数据后，将会单调收敛于正确答案，是一种任何统计方法均有的令人满意的特性。如Joseph Felsenstein（英语：Joseph Felsenstein）在1987年证明，^[13]最大简约法在一致的条件下可以是不一致的。这种已知会发生的情形被称为长枝吸引效应。举例来说，有两个物种（A和C）具有长枝（有高度的碱基置换率），而另外两个物种（B和C）具有短枝。A和B是从共同祖先分化而来，C和D亦是。

为了简单起见，假设我们考虑单一的二元特征（它可以是+或-）。由于从B到D的距离短，在所有情况下，绝大多数会判定B和D是相同的。在此我们假设此两者均为+ （+和-可被任意分配和置换）。在此情况下，有四个其它的可能性。A和C可以均为+，在这种情况下，所有的分类群均相同，且所有的树均具有相同的长度。A可为+C可为-，在这种情况下，仅有一个特征不相同，我们不能学到任何东西，所有的树均具有相同长度。同样地，A可为-C可为+。剩下唯一的可能为A和C均为-。然而，在这种情况下，我们将A和C分成一组，并将B和D分为一组。因此，当我们有一个这种类型的树时，我们收集愈多数据（如研究更多特征），愈倾向得到错误的树。

SAW（以Siddal和Whiting命名）是一个简单且有效的方法来测定树形是否有受长枝吸引影响。若怀疑一对分类群（A和B）发生长枝吸引，只需移除分类群A （“锯”除此分枝）并重新执行分析。然后以相同方法移除B，再次执行分析。如果两者中有任一分类群出现在不同的分枝点，即具有长枝吸引的证据。由于在分析时仅放入一长枝，此长枝不可能会吸引其他分类群，若处理间分类群的位置为一致的，则表示没有长枝吸引的问题。^[14]

估计亲缘关系有几种其他的方法可供选择，包含最大似然法、贝叶斯亲缘关系推论（页面存档备份，存于互联网档案馆）、近邻结合法，和双叉树算法（quartet methods）。其中，前两者均使用似然函数，并且，若使用得当，理论上可避免长枝吸引。此两种方法均为参数的，表示其依赖一个明确的特征演化模型。其已被证明，对于一些次佳的模型，这些方法亦可以是不一致的。^{[来源请求]}

最大简约法的另一个问题为寻找最简约的树是一个NP困难问题^[15]。目前唯一可用、有效的解决方法为，给予一个任意的巨大分类群，利用探索方法不保证最简约的树会被重新找到。这些方法使用爬山算法（hill-climbing algorithms）逐渐接近最佳的树。然而，其已被证明可以有次佳解的“树岛”，且分析可以被困在这些局部最佳（：局部最佳）（local optima）处。因此，需要复杂的、灵活的探索方法，来确保树空间已经被充分探索。一些探索方法可供选择，包括最近邻交换（英语：Nearest_neighbor_interchange）（Nearest Neighbor Interchange, NNI）、子树切断-重连法（英语：Nearest_neighbor_interchange）（Tree Bisection and Reconnection, TBR），及phylogenetic ratchet。这个问题并非最大简约法独有，任何利用到最佳标准的方法均面临相同的问题，且没有简单的解决方法。

批评[编辑]

最大简约法曾被断言其最主要的问题，尤其在古生物学，是其假设两物种要在相同位置共享相同核甘酸的唯一方法为此两者需有血缘关系。这宣告简约法假设所有相似性均为同源（其他解释则为荒谬的，如主张两物种也许没有血缘关系）。但显然并非如此：当以特征的任何型式为基础来估计亲缘关系时，简约法是利用寻找最佳亲缘关系树来测试相似性的同源性。

举例来说，鸟和蝙蝠拥有翅膀，而鳄鱼和人类则无。若这是唯一可用的数据，最大简约法会倾向将鳄鱼和人类分在同一组，鸟和蝙蝠分在同一组（其他亲缘关系推论的方法亦同）。但根据更多数据而非单一特征（翅膀），我们相信实际上比起鸟或鳄鱼，人类和蝙蝠的关系较近。若分析中包含额外的数据，就算仅是微小的片段，如骨骼结构、软组织形态、皮膜、行为、遗传…等，鸟和蝙蝠依据翅膀所产生之微小的亲缘关系讯号，会被支持（人类、蝙蝠）（鸟、鳄鱼）的数据压倒。

简约法常被认为不适合用来推论亲缘关系，因为“演化并非最简约的”。在多数情况下，明确的替代假说并没有被提出，若没替代假说可用，任何统计方法均倾向没有假说。此外，也不清楚若句子“演化为简约”为真，代表什么意义。这可能意味着历史上发生特征的改变的次数，可能比用简约法所估计出来的次数多。由于简约法以发生最少次特征改变来解释树，所以此情况极有可能发生。然而，曾有模拟的研究显示，测试已知的体外培养（in vitro）病毒之亲缘关系，多数情况并非最简约。简约法利用特征改变次数来挑选最佳的树，。只要特征改变在树上是随机分布的（一个合理的虚无预期），则结果不应有偏差。实际上，此方法很健全：利用最大简约法来选树具有最小的偏差。

做一个比喻：根据一开始估计的工作成本来选择承包商，但实际完成的成本很可能会高于初始的估价。尽管如此，选择提供最低估价的承包商，理论上应该可获得最终成本为最低的结果。这是因为，在没有其他数据时，我们会假设所有承包商均具有相同的成本超支风险。实际上，不良的经营手法也许会使此结果产生偏差；在系统发生中亦同，某些特殊的亲缘关系问题（如长枝吸引效应，如上所述）可能会造成偏差。然而，在这两个例子中，基于估计本身，也无法描述结果是否将会产生偏差，或偏差的程度。简约法亦同，在缺乏和其他证据比较的状况下，无法明确描述数据是否会造成误导。

按照同样的思路，简约法以哲学的角度认为发生演化改变是罕见的，或趋同（收敛和逆转）在演化的过程中是少有的。这并非完全正确：简约法认为经历最少次收敛和逆转过程的树为最佳的，但这可能是相对大量趋同事件所产生的结果。更恰当的说法为简约法假设数据中暗指只有最少次的改变。如上述，我们不需认定这是唯一发生的变化，只是当没有证据时，简单地不去推断有发生改变。简单来说，“简约法是做最少的假设，而非假设趋同演化发生的次数是最少的”。

简约法的概念也和奥卡姆剃刀的概念( 即“最简单的解释是最好的”）一致。简约法偏好的解答，需要最少数的未经证实的假设和不被支持的结论。这在科学上是很常见的方法，尤其是当处理系统如此复杂如同拒绝简单模型。简约法不必然要产生一个“简单”的假设。事实上，如同一般规则，多数特征是如此复杂，故没有真正“简单”的解决方法。

参见[编辑]

平稳作用量原理

参考文献[编辑]

^ Walter M. Fitch. Toward defining the course of evolution: minimum change for a specified tree topology. Systematic Zoology. December 1971, 20 (4): 406–416 [2013-01-13]. （原始内容存档于2021-06-29）.
^ ^2.0 ^2.1 ^2.2 E. T. Jaynes, edited by G. Larry Bretthorst. Probability Theory: The Logic of Science. Cambridge, United Kingdom: Cambridge University Press, Cambridge. 2003. ISBN 9780521592710.
^ Michener, Charles D. and Sokal, Robert R. A Quantitative Approach to a Problem in Classification. Evolution. Jan 1957, 11 (2): 130–162.
^ Edwards, A.W.F., and L.L. Cavalli-Sforza. 1964. Reconstruction of evolutionary trees. pp. 67–76 in Phenetic and Phylogenetic Classification, ed. V. H. Heywood and J. McNeill. Systematics Association pub. no. 6, London.
^ Cavalli-Sforza, L.L. and A.W.F. Edwards. 1965. Analysis of human evolution. pp. 923–933 in Genetics Today. Proceedings of the XI International Congress of Genetics, The Hague, The Netherlands, September 1963, volume 3, ed. S. J. Geerts, Pergamon Press, Oxford.
^ Camin, J. H., and R. R. Sokal. 1965. A method for deducing branching sequences in phylogeny. Evolution 19: 311-326.
^ Bartcher, R. L. (1966). Fortran IV program for estimation of cladistic relationships using the IBM 7040. Lawrence, Kan.: University of Kansas.
^ Eck, R. V. and M. O. Dayhoff. 1966. Atlas of Protein Sequence and Structure. National Biomedical Research Foundation, Silver Springs, Maryland.
^ Fitch and Margoliash 1967. Fitch WM & Margoliash E (1967) Construction of phylogenetic trees. Science 155:279 284.
^ Elliott Sober. Parsimony in Systematics: Philosophical Issues. Annual Review of Ecology and Systematics. November 1983, 14: 335–357. doi:10.1146/annurev.es.14.110183.002003.
^ M. D. Hendy; D. Penny. Branch and bound algorithms to determine minimal evolutionary trees. Mathematical Biosciences. 1982, 60: 133–142.
^ D. R. Maddison. The discovery and importance of multiple islands of most-parsimonious trees. Systematic Zoology. 1991, 40: 315–328.
^ Joseph Felsenstein. Cases in which Parsimony or Compatibility Methods Will be Positively Misleading. Systematic Zoology. 1978年12月, 27 (4): 401–410.
^ Mark E. Siddall; Michael F. Whiting. Long-Branch Abstractions. Cladistics. 1999, 15: 9–24.
^ William H. E. Day. Computational complexity of inferring phylogenies from dissimilarity matrices. Bulletin of Mathematical Biology. 1987, 49 (4): 461–467.

[Fitch-1] Walter M. Fitch. Toward defining the course of evolution: minimum change for a specified tree topology. Systematic Zoology. December 1971, 20 (4): 406–416 [2013-01-13]. （原始内容存档于2021-06-29）.

[logic-2] 2.0 ^2.1 ^2.2 E. T. Jaynes, edited by G. Larry Bretthorst. Probability Theory: The Logic of Science. Cambridge, United Kingdom: Cambridge University Press, Cambridge. 2003. ISBN 9780521592710.

[michener-and-sokal-3] Michener, Charles D. and Sokal, Robert R. A Quantitative Approach to a Problem in Classification. Evolution. Jan 1957, 11 (2): 130–162.

[4] Edwards, A.W.F., and L.L. Cavalli-Sforza. 1964. Reconstruction of evolutionary trees. pp. 67–76 in Phenetic and Phylogenetic Classification, ed. V. H. Heywood and J. McNeill. Systematics Association pub. no. 6, London.

[5] Cavalli-Sforza, L.L. and A.W.F. Edwards. 1965. Analysis of human evolution. pp. 923–933 in Genetics Today. Proceedings of the XI International Congress of Genetics, The Hague, The Netherlands, September 1963, volume 3, ed. S. J. Geerts, Pergamon Press, Oxford.

[6] Camin, J. H., and R. R. Sokal. 1965. A method for deducing branching sequences in phylogeny. Evolution 19: 311-326.

[7] Bartcher, R. L. (1966). Fortran IV program for estimation of cladistic relationships using the IBM 7040. Lawrence, Kan.: University of Kansas.

[8] Eck, R. V. and M. O. Dayhoff. 1966. Atlas of Protein Sequence and Structure. National Biomedical Research Foundation, Silver Springs, Maryland.

[9] Fitch and Margoliash 1967. Fitch WM & Margoliash E (1967) Construction of phylogenetic trees. Science 155:279 284.

[10] Elliott Sober. Parsimony in Systematics: Philosophical Issues. Annual Review of Ecology and Systematics. November 1983, 14: 335–357. doi:10.1146/annurev.es.14.110183.002003.

[11] M. D. Hendy; D. Penny. Branch and bound algorithms to determine minimal evolutionary trees. Mathematical Biosciences. 1982, 60: 133–142.

[12] D. R. Maddison. The discovery and importance of multiple islands of most-parsimonious trees. Systematic Zoology. 1991, 40: 315–328.

[13] Joseph Felsenstein. Cases in which Parsimony or Compatibility Methods Will be Positively Misleading. Systematic Zoology. 1978年12月, 27 (4): 401–410.

[14] Mark E. Siddall; Michael F. Whiting. Long-Branch Abstractions. Cladistics. 1999, 15: 9–24.

[15] William H. E. Day. Computational complexity of inferring phylogenies from dissimilarity matrices. Bulletin of Mathematical Biology. 1987, 49 (4): 461–467.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]