决策用强化与系统性机器学习
本书特色
[
机器学习是人工智能领域中一个极其重要的研究方向。强化学习是机器学习中的一个重要分支。作为解决序贯优化决策的有效方法,强化学习有效地应用于计算科学、自动控制、机器人技术等各个领域。
当前,强化学习的核心任务是提高学习效率,本书就是针对此问题展开的。第1章介绍系统概念和增强机器学习,它建立了一个突出的相同的机器学习系统范例;第2章将更多关注机器学习的基本原理和多视角学习;第3章关于强化学习;第4章处理机器学习系统和模型建立的问题;决策推理等重要的部分将在第5章展开;第6章讨论了自适应机器学习;第7章讨论了多视角和全局系统性机器学习;第8章讨论了增量学习的需要和知识表示;第9章处理了知识增长方面的问题;第10章讨论了学习系统的建立。
本书适合于机器学习、自动化技术、人工智能等方面的相关专业教师与研究生阅读,也可供自然科学和工程领域相关研究人员参考。
]
内容简介
[
本书包括强化的不同方面,通过机器学习来建立知识库。本书有助于计划通过智能学习和实验做出智能机器的人并尝试新的方式,打开一种相同的新范例。本书第1章主要介绍系统概念,如机器学习、强化学习、系统学习、系统性机器学习等;第2章主要介绍系统性和多视角的机器学习;第3~9章主要介绍本书的主要内容——决策用强化与系统性学习的各个方面内容,有强化学习、系统性机器学习、推理和信息集成、自适应学习、全局系统性学习、增量学习及表示和知识增长。第10章列举了一些例子来说明如何构建一个学习系统。
]
作者简介
[
Parag Kulkarni博士是普纳埃拉特研究所(EKLaT Research,Pune)的CEO和首席科学家。他在知识管理、电子商务、智能系统和机器学习咨询、研究和产品建设等领域有超过20年的经验。印度理工学院和加尔各答印度管理研究院的校友,Kulkarni博士是IIM的兼职教授、捷克马萨里克大学访问研究员和普纳工程学院兼职教授。他领导的公司、研究实验室和团体,其中包括很多IT公司,有艾蒂尔公司、西门子信息系统有限公司、普纳的卡皮森公司和新加坡的ReasonEdge公司。他通过战略创新和研究引领了很多公司成功创业。瑞士的UGSM皇家商业学校授予Kulkarni荣誉博士学位。他是三个专利的共同发明人,并合著了超过100篇研究论文并有著作若干本。
]
目录
译者序原书前言原书致谢关于作者第1章强化与系统性机器学习11.1简介11.2监督学习、无监督学习、半监督学习和强化学习11.3传统机器学习方法和机器学习发展历史31.4什么是机器学习?61.5机器学习问题61.5.1学习的目标61.6学习模式71.7机器学习技术和范例91.8什么是强化学习?111.9强化函数和环境函数121.10强化学习的需求131.11强化学习和机器智能141.12什么是系统学习?141.13什么是系统性机器学习?151.14系统性机器学习的重点151.15强化性机器学习和系统性机器学习161.16车辆检测问题的案例研究161.17小结16参考文献17第2章全系统原理、系统性和多视角的机器学习182.1简介182.1.1什么是系统性学习?192.1.2历史202.2什么是系统性机器学习?212.2.1基于事件的学习212.3广义系统性机器学习框架232.3.1系统定义242.4多视角决策和多视角学习262.4.1基于完整信息的表示322.4.2基于部分信息的表示322.4.3单视角决策方案图322.4.4双重视角决策方案图322.4.5多视角决策方案图322.4.6定性信念网络和影响图332.5动态和交互式决策332.5.1交互决策图332.5.2决策图和影响图中时间的角色342.5.3系统性视角的建立342.5.4信息整合352.5.5建立典型决策方案图352.5.6受限信息352.5.7多决策者系统在系统性学习中的角色352.6系统性学习框架392.6.1数学模型392.6.2系统性学习的方法392.6.3自适应系统性学习402.6.4系统性学习框架412.7系统分析412.8案例学习:在酒店行业中需要系统性学习432.9小结44参考文献44第3章强化学习453.1简介453.2学习决策者483.3回报和奖励的计算503.3.1方案和连续任务503.4强化学习和自适应控制513.5动态系统543.5.1离散事件动态系统543.6强化学习和控制553.7马尔科夫性质和决策过程553.8价值函数563.8.1行动和价值563.9学习*优策略(有模型和无模型法)573.10动态规划573.10.1动态系统性质573.11自适应动态规则583.11.1时间差分学习593.11.2q学习603.11.3统一的视图603.12范例——拳击训练器的强化学习613.13小结61参考文献61第4章系统性机器学习和模型624.1简介624.2系统学习的框架634.2.1影响空间644.2.2交互作用为中心的模型694.2.3以结果为中心的模型694.3捕捉系统视图704.4系统交互的数学表达734.5影响函数744.6决策影响分析744.6.1时空界限754.7小结80第5章推理和信息集成825.1简介825.2推理机制和需要835.2.1情景推理855.2.2推理确定影响855.3情景和推理的集成885.4统计推理和归纳915.4.1直接推理915.4.2间接推理915.4.3信息推理915.4.4归纳925.5纯似然方法925.6贝叶斯范例推理935.6.1贝叶斯定理935.7基于时域推理935.8推理建立系统观点945.8.1信息集成945.9小结96参考文献97第6章自适应学习986.1简介986.2自适应学习和自适应系统986.3什么是自适应机器学习1016.4基于方案的适应性和学习方法1016.4.1动态适应性和情景感知的学习1026.5系统学习和自适应学习1046.5.1多学习器的使用1056.5.2系统自适应机器学习1086.5.3自适应应用的设计1106.5.4自适应学习的需要和适应的原因1116.5.5适应类型1126.5.6自适应框架1146.6竞争学习和自适应学习1156.6.1适应性函数1166.6.2决策网络1186.6.3自适应学习方案1196.7范例1206.7.1案例研究:基于自适应学习的文本1206.7.2自适应学习的文档挖掘1216.8小结122参考文献122第7章多视角和全局系统性的学习1237.1简介1237.2多视角方案构建1247.3多视角决策和多视角学习1267.3.1视角结合1267.3.2影响图和部分方案决策表示图1277.3.3表示决策方案图(rdsd)1307.3.4范例:部分方案决策表示图(pdsrd)表示的不同视角获取的城市信息1317.4全局系统性学习和多视角途径1347.4.1分散信息整合1357.4.2多视角和全局系统知识表示1357.4.3什么是多视角方案?1357.4.4特定方案1367.5基于多视角途径的案例研究1367.5.1交通控制器用多视角途径1377.5.2情感检测用多视角途径模型1387.6多视角方法的局限性1437.7小结143参考文献144第8章增量学习和知识表示1458.1简介1458.2为什么增量学习?1468.3学习已经学会的1478.3.1绝对增量学习1488.3.2选择增量学习1498.4监督增量学习1578.5增量无监督学习和增量聚类1588.5.1增量聚类:任务1608.5.2增量聚类:方法1618.5.3阈值1618.6半监督增量学习1628.7增量与系统性学习1638.8增量接近值和学习方法1648.8.1增量学习方法11658.8.2增量学习方法21668.8.3计算c值增量1668.9学习与决策模型1698.10增量分类技术1698.11案例分析:增量文档分类1708.12小结171第9章知识增长:机器学习的视角1739.1简介1739.2短暂的历史和相关工作1749.3知识增长和知识启发1789.3.1策略使用进行知识启发1789.3.2基于目标的知识启发1799.3.3基于过程的知识启发1799.4生命周期1809.4.1知识水平1819.4.2直接知识1819.4.3间接知识1829.4.4程序知识1829.4.5问题1829.4.6决策1829.4.7知识生命周期1839.5增量知识表达1849.6案例学习和遗忘学习1869.7知识的扩充:技术和方法1879.7.1知识增量技术1879.7.2知识增量方法1889.7.3提取知识的机制1899.8启发式学习1909.9系统性机器学习和知识获取1909.9.1全方位知识获取1919.9.2系统知识管理和先进的机器学习1929.10在复杂环境下的知识增量1939.11案例研究1939.11.1银行案例研究1939.11.2软件开发公司1949.11.3杂货集市/零售集市1959.12小结195参考文献196第10章构建学习系统19710.1简介19710.2系统性学习系统19710.2.1学习单元19910.2.2知识库20010.2.3性能单元20010.2.4反馈单元20010.2.5允许测量的系统20010.3算法选择20110.3.1k近邻(knn)20110.3.2支持向量机(svm)20210.3.3质心法20210.4知识表示20310.4.1实用方案和案例研究20310.5学习系统的设计20410.6让系统表现得更智能20410.7案例学习20510.8整体知识框架和强化学习的应用20510.8.1智能算法的选择20710.9智能决策——部署和知识采集以及重用20810.10基于案例的学习:人体情感检测系统20910.11复杂决策问题的整体视角21110.12知识表示和资源查找21310.13组件21510.13.1范例21510.14学习系统和智能系统的未来21610.15小结217附录218附录a统计学习方法218a.1概率218a.1.1互斥事件218a.1.2独立事件218a.2贝叶斯分类219a.2.1朴素贝叶斯分类220a.2.2贝叶斯分类器的优点和缺点221a.3回归221a.3.1线性222a.3.2非线性222a.3.3回归的其他方法222a.4粗糙集223a.4.1不可分辨关系223a.4.2集近似224a.4.3边界区域224a.4.4粗糙集和清晰集224a.4.5约简224a.4.6可有可无和不可缺少的属性224a.5支持向量机224参考文献225附录b马尔科夫过程225b.1马尔科夫过程225b.1.1案例226b.1.2解决步骤226b.1.3长期227b.1.4马尔科夫过程示例228b.2半马尔科夫过程231b.2.1建议231b.2.2验证232b.2.3推论232
封面
书名:决策用强化与系统性机器学习
作者:库尔卡尼
页数:232
定价:¥79.0
出版社:机械工业出版社
出版日期:2015-07-01
ISBN:9787111502418
PDF电子书大小:47MB 高清扫描完整版
本文标题:《决策用强化与系统性机器学习》PDF下载
资源仅供学习参考,禁止用于商业用途,请在下载后24小时内删除!