摘要:提出了一種基于流演算的最優規劃程序設計語言OPPLFC(optimal planning programming language basedon fluent calculus)。通過定義動作表達式來描述順序、并發、非確定選擇等復雜動作,利用最優規劃算子實現最優規劃。OPPLFC的最優規劃算子是通過引入強化學習報酬函數的多次離線執行。當與前一次離線執行所得的報酬相比較,值小則所得的動作序列為當前最優規劃。給出了OPPLFC語言的組成、程序語義及其實現。最后,通過實例驗證了OPPLFC語言的可行性。