对偶控制理论

维基百科,自由的百科全书

对偶控制理论(dual control theory)是控制理论的一个分支,常用在控制初始特性不明的系统。名为对偶是因为控制系统有以下二个目的:

  1. 动作(Action):依现有的资讯,尽可能的控制此系统。
  2. 调试(Investigatio):以此系统进行测试,以了解此系统,并设法在未来可以控制的更好。

这二个目的有时会互相冲突。

对偶控制理论是Alexander Aronovich Fel'dbaum在1960年代发展的。他证明了可以用动态规划找到最佳控制法则,但在实际上是不可行的。因此发展了许多设计亚最佳(Suboptimal)对偶控制器的方法。

例子[编辑]

以汽车来举例,若有人要开一部新车,希望可以又便宜又平顺的到达目的地,但又想知道汽车的加速性能、方向盘及刹车的情形,以便知道如何驾驶这部车,这情形下会依此目的有一些测试性的驾驶行为。同様的,对偶控制会在系统中加入所谓探测性的信号,可能会影响短期的特性,但收集到的资料可能会对长期的特性有帮助。

参考资料[编辑]

  • Feldbaum, A.A. Dual control theory, Part I. Automation and Remote Control. April 1961, 21 (9): 874–880 [September 1960 (in Russian, pp. 1240–1249)]. 
  • Feldbaum, A.A. Dual control theory, Part II. Automation and Remote Control. May 1961, 21 (11): 1033–1039 [November 1960 (in Russian, pp. 1453–1464)]. 
  • Wittenmark, B. Adaptive Dual Control (PDF). Lund University. [2015-12-11]. (原始内容 (Seminar handout)存档于2015-09-23). 
  • Wittenmark, B. Adaptive Dual Control Methods: An Overview. Lund University. CiteSeerX: 10.1.1.25.7446可免费查阅.