吸收因子

[拼音]:suiji kongzhi lilun

[英文]:stochastic control theory

控制理論中把隨機過程理論與最優控制理論結合起來研究隨機系統的分支。隨機系統指含有內部隨機引數、外部隨機干擾和觀測噪聲等隨機變數的系統。隨機變數不能用已知的時間函式描述,而只能瞭解它的某些統計特性。自動控制系統分為確定性系統和不確定性系統兩類,前者可以通過觀測來確定系統的狀態,後者則不能。隨機系統是不確定性系統的一種,其不確定性是由隨機性引起的。嚴格地說,任何實際的系統都含有隨機因素,但在很多情況下可以忽略這些因素。當這些因素不能忽略時,按確定性控制理論設計的控制系統的行為就會偏離預定的設計要求,而產生隨機偏差量。飛機或導彈在飛行中遇到的陣風,在空間環境中衛星姿態和軌道測量系統中的測量噪聲,各種電子裝置中的噪聲,生產過程中的種種隨機波動等,都是隨機干擾和隨機變數的典型例子。隨機控制系統的應用很廣,涉及航天、航空、航海、軍事上的火力控制系統,工業過程控制,經濟模型的控制,乃至生物醫學等。

隨機控制理論研究的課題包括隨機系統的結構特性和運動特性(如動態特性、能控性、能觀測性、穩定性)的分析,隨機系統狀態的估計,以及隨機控制系統的綜合(即根據期望效能指標設計控制器)。隨機系統中含有隨機變數,所以在研究中需要使用隨機過程的基本概念和概率統計方法。嚴格實現隨機最優控制是很困難的。對於線性二次型高斯(LQG)隨機過程控制問題,包括它的特例最小方差控制問題,可以應用分離原理把隨機最優控制問題分解成狀態估計問題和確定性最優控制問題,最終能得到全域性最優的結果。但對於一般的隨機控制問題應用分離原理只能得到次優的結果。

隨機狀態模型

隨機系統在連續時間情形下的動態過程,常可用隨機微分方程

描述,式中x(t)為狀態向量,dx(t)為由時刻t至t+dt狀態的增量,u(t)為控制輸入,θ為隨機引數,w(t)為獨立增量隨機過程,其微分dw(t)可理解為白噪聲。在離散時間情形下的動態過程則可採用隨機差分方程

描述。式中t=0,1,2,…為離散時間變數,w(t)為獨立白色噪聲序列。兩種情況下系統的輸出方程都為:

y(t)=h[x(t),θ,t]+v(t)

式中v(t)為輸出通道中的隨機干擾,假定為白色噪聲。

隨機最優控制

使隨機控制系統的某個效能指標泛函取極小值的控制稱為隨機最優控制。由於存在隨機因素,這種效能指標泛函需要表示為統計平均(求數學期望)的形式:

式中E{·}表示{·}的均值即數學期望。使效能指標J為極小的最優控制常可取為開環和反饋控制兩種形式。如果控制過程中決定u(t)所依據的只是設計時過程特性和隨機變數的資訊,沒有進一步的測量和更新,這種控制策略就稱為是開環的。若在決定t時刻的控制作用 u(t)時可以直接利用τ時刻的實時測量值y(τ),則稱控制u(t)具有反饋形式,其中要求τ≤t,這是因果性或物理可實現性所要求的。按照利用實時資訊的充分程度,又可把反饋形式的控制策略分為兩種情形。當只利用這些資訊來控制狀態變數,而沒有通過實時觀測來估計和改進各隨機變數的統計特性並修改控制策略時,這種策略稱為是被動反饋式(簡稱反饋式)的。若控制策略兼有上述“控制”和“估計”兩種功能並具有自行修正的能力,則稱為閉環策略(或主動反饋策略)。這種“反饋”和“閉環”的差別是不確定性控制問題所特有的。A.A.費爾德包姆最先指出閉環隨機最優控制策略的這種雙重功能,並稱之為二重最優控制。閉環(或二重)最優策略可達到在已有資訊條件下的最好品質或全域性最優解。同時它還具有不斷按照實時測量改進對不確定性的認識並修正策略的功能,也稱為隨機自適應最優控制。閉環最優控制的求解很困難,通常只能根據最優解的定性性質來構造次優解。只對某些特殊問題才可能給出定量解法。

隨機最優控制有兩個重要的性質。由於存在不確定性,控制作用常寧可取得弱一些,保守一些。這稱為謹慎控制。另一方面為更好和更快地進行估計,必須不斷激發系統中各種運動模式,為此需要加入一些試探作用。試探作用的大小,則根據增加的誤差、直接費用和所帶來的好處等因素加以折衷權衡進行選擇。謹慎和試探已成為設計隨機控制策略的兩個重要原則。

LQG問題

線性 (Linear)二次型 (quadratic)高斯(Gaussian)隨機過程控制問題是用途最廣的且可以用分離原理設計全域性最優控制系統的一類問題。對於離散時間的情況,受控物件用如下線性差分方程來描述:

效能指標取為二次型的形式:

式中上標T表示向量的轉置,裝置噪聲w(t)和量測噪聲v(t)為高斯隨機過程。並且假定控制 u(t)可依據t時刻及以前的觀測資料y(t),y(t-1),…來確定。按照分離原理,隨機最優控制的結構具有圖中的形式。它由狀態估值器給出狀態x 的估計值憫,再由憫按線性狀態反饋律u=-L憫確定控制量u。這裡狀態反饋矩陣L是在不考慮隨機干擾w(t)和v(t)時的確定性最優控制問題的解:

而P(t)滿足黎卡提方程

和邊界條件P(N)=s。狀態估計一般用卡爾曼濾波器來實現。整個控制結構可用微型或小型計算機來實現。

參考書目

阿斯特勒姆著,潘裕煥譯:《隨機控制理論導論》,科學出版社,北京,1983。(K.J.Astr╂m,Introduction to Stochastic Control Theory,Academic Press,New York,1970.)