记录贴,自用,动态规划相关
动态规划(Dynamic Programming,DP)的起源可以追溯到20世纪40年代,由美国数学家理查德·贝尔曼(Richard Bellman)所开创,以下是动态规划的发展历程:
• 起源与初步研究(20世纪40年代 - 1950年):贝尔曼最初关注多阶段决策过程的优化问题,例如水利资源的多级分配、库存管理等。在这些问题中,决策过程可以分解为多个阶段,每个阶段的决策会影响后续阶段的状态,最终目标是找到全局最优解。1949年,贝尔曼提出了著名的最优化原理,即“任何最优策略的子策略本身也必须是最优的”。该原理将复杂的多阶段问题分解为一系列子问题,通过递归求解子问题的最优解,最终得到全局最优解。1950年,为避免美国国防部对“数学研究”的偏见,贝尔曼将这一方法命名为“动态规划”。