动态规划Dynamic Programming ?五十年代贝尔曼(B. E. Bellman)为代表的研究成果 ?属于现代控制理论的一部分 ?以长远利益为目标的一系列决策 ?最优化原理,可归结为一个递推公式 2 第一节多阶段决策过程及实例 一、多阶段决策过程 在生产和科学试验中,有一类活动的过程,由于它的特殊性, 可将过程分为若干个互相联系的阶段,在它的每一个阶段都需要 作出决策,从而使整个过程达到最好的活动效果。因此,各个阶 段决策的选取不是任意的,它依赖于当前面临的状态,又影响以 后的发展。当各个阶段的决策确定后,就组成了一个决策序列, 因而也就决定了整个过程的一条活动路线。这种可以把一个问题 看作是一个前后关联具有链状结构的多阶段过程就称为多阶段决 策过程,也称序贯决策过程。这种问题就称为多阶段决策问题。 决策 决策 决策 状态 状态 状态 状态 状态 1 2 …… n 3 在多阶段决策问题中,各个阶段采取的决策,一 般来说是与时间有关的,决策依赖于当前的状态,又 随即引起状态的转移,一个决策序列就是在变化的状 态中产生出来的,故有“动态”的含义。因此,把处理 它的方法称为动态规划方法。但是,一些与时间没有 关系的静态规划问题,只要人为的引进“时间”因素, 也可把它视为多阶段决策问题,用动态规划方法去处 理。 4 二、实例(典型示例) 例1 如下图,给定一个线路网络,两点之间连线上的数 字表示两点间的距离(或费用),试求一条由A到G的铺 管线路,使总距离为最短(或总费用最小)。 C 6 C1
8.动态规划1.pdf
下载此电子书资料需要扣除0点,