图书介绍

摄动马尔可夫决策与哈密尔顿圈【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

摄动马尔可夫决策与哈密尔顿圈
  • 刘克著 著
  • 出版社: 中国科技大学出版社
  • ISBN:9787312022418
  • 出版时间:2009
  • 标注页数:332页
  • 文件大小:11MB
  • 文件页数:347页
  • 主题词:马尔可夫决策;哈密顿圈

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

摄动马尔可夫决策与哈密尔顿圈PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一部分 马氏决策过程与摄动3

第1章 绪论3

1.1序列决策模型3

1.2马氏决策过程的例子5

1.3马氏决策过程的定义与记号10

决策时刻与周期10

状态与行动集11

转移概率和报酬11

历史、决策规则与策略12

诱导过程、效用准则与马氏策略优势14

1.4马氏决策过程的起源和发展17

第2章 有限阶段模型21

2.1最优准则21

2.2有限阶段的策略迭代和最优方程22

2.3最优策略的存在性和算法26

2.4最优策略的结构29

2.5单调策略的最优性32

第3章 无限阶段折扣模型37

3.1最优准则37

3.2最优方程38

3.3最优策略的存在性46

3.4策略迭代算法50

3.5值迭代算法55

3.6改进的策略迭代算法58

3.7线性规划算法60

3.8最优单调策略67

3.9最优策略的结构70

第4章 无限阶段平均模型78

4.1最优准则78

4.2最优平稳策略的存在性80

4.3平稳策略的一些特征85

4.4最优方程与策略迭代算法97

4.5单链的线性规划与相关问题108

极限平均频率112

带约束模型问题117

方差问题118

4.6多链的线性规划与相关问题121

对偶可行解与随机平稳策略122

基本可行解与确定性决策规则126

最优解与最优策略126

4.7平均准则下的Bellman最优原则129

第5章 摄动MDP134

5.1预备知识134

5.2一些基本记号和定义137

5.3摄动平均问题的渐进性和极限控制原则138

5.4折扣准则的摄动问题144

5.5一般的摄动146

5.6单摄动极限平均MDP的算法153

假设与渐进性质153

数学规划和极限马尔可夫决策问题160

聚合-分解算法167

5.7进一步的研究进展170

折扣权重摄动模型170

折扣平均权重摄动问题173

第二部分 摄动MDP与哈密尔顿圈179

第6章 HC与MDP179

6.1哈密尔顿圈问题180

6.2有向图到MDP的嵌入181

6.3平稳策略的分类184

6.4约束折扣MDP与HC186

6.5约束折扣MDP的求解191

6.6 HC与TSP196

第7章 HCP嵌入MDP的摄动201

7.1转移概率的摄动201

转移概率的对称线性摄动202

转移概率的非对称线性摄动203

转移概率的非对称二次摄动204

7.2摄动下子图的稳态分布205

7.3非对称线性摄动下的几个例子213

7.4非对称线性摄动下HC的性质218

7.5更为精细的分析228

7.6开问题和有关猜想239

第8章 频率空间上的分析242

8.1长期平均MDP频率空间中的HCP242

8.2二次非对称摄动与新目标函数247

8.3启发式内点算法254

内点算法简介255

关于(QP)求解的启发式算法257

数值计算例子258

8.4一些开问题及其他260

第9章 双随机摄动与HC267

9.1基本矩阵267

9.2再谈双随机摄动273

9.3渐进表达式278

9.4优化问题与HC的全局最优性285

非线性规划问题285

方向导数286

HC既是局部也是全局最小288

9.5哈密尔顿间隙291

9.6对称双随机矩阵的探讨295

9.7混合时间及其变化的最小化301

从不可约链到一般的情形302

迹与对角线上的元素305

摄动带来的好处307

带有对称线性摄动的双随机矩阵310

第10章 将来的研究方向和结束语315

10.1将来的研究方向315

10.2结束语318

参考文献319

索引330

热门推荐