动态规划Dynamic Programming
?五十年代贝尔曼(B. E. Bellman)为代表的研究成果
?属于现代控制理论的一部分
?以长远利益为目标的一系列决策
?最优化原理,可归结为一个递推公式
2
第一节多阶段决策过程及实例
一、多阶段决策过程
在生产和科学试验中,有一类活动的过程,由于它的特殊性,
可将过程分为若干个互相联系的阶段,在它的每一个阶段都需要
作出决策,从而使整个过程达到最好的活动效果。因此,各个阶
段决策的选取不是任意的,它依赖于当前面临的状态,又影响以
后的发展。当各个阶段的决策确定后,就组成了一个决策序列,
因而也就决定了整个过程的一条活动路线。这种可以把一个问题
看作是一个前后关联具有链状结构的多阶段过程就称为多阶段决
策过程,也称序贯决策过程。这种问题就称为多阶段决策问题。
决策 决策 决策
状态 状态 状态 状态 状态
1 2 …… n
3
在多阶段决策问题中,各个阶段采取的决策,一
般来说是与时间有关的,决策依赖于当前的状态,又
随即引起状态的转移,一个决策序列就是在变化的状
态中产生出来的,故有“动态”的含义。因此,把处理
它的方法称为动态规划方法。但是,一些与时间没有
关系的静态规划问题,只要人为的引进“时间”因素,
也可把它视为多阶段决策问题,用动态规划方法去处
理。
4
二、实例(典型示例)
例1 如下图,给定一个线路网络,两点之间连线上的数
字表示两点间的距离(或费用),试求一条由A到G的铺
管线路,使总距离为最短(或总费用最小)。
C 6
C1
8.动态规划1.pdf
下载此电子书资料需要扣除0点,





