第三章:动态规划 3.1 动态规划的基本概念 一、动态决策问题: 决策过程具有阶段性和时序性(与时间有关)的决策问题。即决策过程可划分为明显的阶段。 二、什么叫动态规划 (D.P.– Dynamic Program) : 多阶段决策问题最优化的一种方法。 广泛应用于工业技术、生产管理、企业管理、经济、军事等领域。 三、动态规划 (D.P.) 的起源: 1951 年 ,( 美)数学家 R.Bellman 等提出最优化原理,从而建立动态规划,名著《动态规划》 于 1957 年出版。 四、动态决策问题分类: 1 、按数据给出的形式分为: 离散型动态决策问题。 连续型动态决策问题。 2 、按决策过程演变的性质分为: 确定型动态决策问题。 随机型动态决策问题。 五、名词术语 D3(S3)={X3(C1),X3(C2),X3(C3)}={D1,D2,D3}=S4 , D4(S4)={X4(D1),X4(D2),X4(D3)}={E1,E2}=S5 D5(S5)={X5(E1),X5(E2)}={F;F}={F} 。 3.2 最优化原理 一、 R.Bellman 最优化原理: 作为整个过程的最优策略,无任过去的状态和决策如何,对前面的决策形成状态而言, 余下的诸决策必构成最优策略。 即:若M是从A到B最优路线上的任一点,则从M到B的路线也是最优路线。 3.3 DP 建模及求解 一、建模条件: 决策过程本身具有时顺序性或可以转化为具有时顺序性的决策问题,均可建立动态规划数学模型求解。 二、典型动态决策问题建模及其求解 1 、最短路线问题 例:求下列图中A到F的最短路线及最短路线值。 图上计算 例 某公司拟将 60 万元的投资,分配给下属四个工厂扩建用。每个工厂扩建后的利润与投资额的大小有关,投资后的利润函数由表给出。 最优策略为( 40 , 20 )。即对第一个工厂投资 40 万元,对第二个工厂投资 20 万元,此时最大利润为 120 万元。 最优策略为( 10 ,0)或(0, 10 ),最大利润为 20 万元。 f2(0)=0, 最优策略为(0,0),最大利润为0万元。 于是得表 于是得表 最优策略为( 20 ,0, 30 , 10 )。最大利润为 160 万元。 也就是说,公司在投资分配时,对第一个工厂投资 20 万元,对第二个工厂不投资,对第三个工厂投资 30 万元,对第四个工厂投资 10 万元,此时会得到 160 万元的最大利润。 当 k=2 时,有 当 s2=0 ,1,2,3时, x2 =0 ;当 s2=4 ,5,6,7时, x2 =0 或1;当 s2=8 ,9, 10 时,, x2 =0 ,1,2。 由此确定 f2(s2) 。现将有关数据列入表3中。 * 解析法 例 机器负荷分配问题. 某种机器可以在高低两种不同的负荷下进行生产,在高负荷下生产时.产品的年产量g和投入生产的机器数量x的关系为g= g(x) ,这时,机器的年完好率为a,即如果年初完好机器数为 x, 到年终时完好的机器数就为 ax(0 <a< 1) .在低负荷下生产时,产品的年产量h和投入生产的机器数量y的关系为h= h(y) ,相应的完好率为, b(0
下载此电子书资料需要扣除0点,