湖南大学人工智能课件4.pptx

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章超越经典的有哪些信誉好的足球投注网站内容提要局部有哪些信誉好的足球投注网站算法不确定动作的有哪些信誉好的足球投注网站使用部分可观察信息的有哪些信誉好的足球投注网站联机有哪些信誉好的足球投注网站局部有哪些信誉好的足球投注网站算法在许多最优化问题中,我们不是要寻找到达目标状态的路径,而是找到目标状态本身。N皇后问题:局部有哪些信誉好的足球投注网站算法局部有哪些信誉好的足球投注网站算法:从单个当前结点出发,通常只移动到它的邻近状态而不保留有哪些信誉好的足球投注网站路径优点:很少的内存能在很大的或者无限的状态空间中找到合理的解爬山法爬山法缺点?依据初始状态,得到局部最大值爬山法h=直接或者间接相互攻击的皇后对数h=17(左图)h=1(右图)局部极小值模拟退火有哪些信誉好的足球投注网站爬山法不完备,随机法效率低,考虑结合两者产生了模拟退火有哪些信誉好的足球投注网站基本思想:允许算法向坏的方向移动以摆脱局部最大值,但这种移动随着时间的推移概率逐步下降如果时间下降得足够的慢,那么模拟退火算法找到一个全局最优值的概率接近于1模拟退火有哪些信誉好的足球投注网站局部束有哪些信誉好的足球投注网站随机产生k个状态,然后每一步从所有的后继状态中选择k个最佳的后继状态直到找到目标状态。(内存中保留K个状态)随机束有哪些信誉好的足球投注网站:不是找到k个最佳,而是随机找到k个后继状态,随机概率与状态值成正比。遗传算法一个后继状态由两个父状态决定以k个随机产生的状态开始(population)一个状态表示成一个字符串定义一个健康度量函数用来评价状态的好坏程度通过选择,交叉,突变的操作产生下一轮状态遗传算法健康度量函数: 非冲突的皇后数量(min = 0, max = 8 × 7/2 = 28)24/(24+23+20+11) = 31%,23/(24+23+20+11) = 29%遗传算法样本被选择繁衍后代的概率正比于它的健康度函数值发生交叉操作的概率需要预先设定,交叉位置随机产生发生突变操作的概率需要预先设定,通常远小于交叉概率使用不确定性动作的有哪些信誉好的足球投注网站环境是完全可观察的和确定的可以知道任何动作序列之后达到的状态环境是部分可观察或者是不确定的无法准确预知未来状态需根据未来感知信息制定相应的行为 使用不确定性动作的有哪些信誉好的足球投注网站例子:真空洗尘器世界的不稳定行为在一块脏区域洗尘可以使该区域干净,有时也会清洁邻近区域在干净区域洗尘可能是该区域弄脏Suck when state=1If state=5 then [right,suck]Else do nonthing与或有哪些信誉好的足球投注网站树或结点必须选择行动在用圆圈表示的与结点上必须处理所有后继解用粗黑线标出Q: LOOP什么意思?无观察信息的有哪些信誉好的足球投注网站Agent 感知不到任何信息,称为无传感问题,也称相容问题无传感问题是可解的还是无解的?可解!真空吸尘器世界无传感问题的可解性:初始状态:{1,2,3,4,5,6,7,8}“向右”操作后:{2,4,6,8}“洗尘”操作后{4,8}“向左”操作后{1,7}“洗尘”操作后目标状态{7}在信念状态解无观察信息的问题无观察信息的有哪些信誉好的足球投注网站无观察信息问题P的定义信念状态:包含物理状态中每个可能的集合,假定N个物理状态,最多有2N个信念状态初始状态:所有物理状态的集合行动:转移模型:对于确定行动对于不确定行动目标测试:信念状态中的所有物理状态都满足目标状态路径开销:假定所有状态下一个行动的开销相同无观察信息的有哪些信誉好的足球投注网站256个可能的信念状态只有12个可达;初始状态出发的行动序列{S,L,S}与{R,L,S}达到相同的信念状态{5,7}如果一个行动序列是信念状态b的解,那么它也是b的任何子集的解部分可观察信息的有哪些信誉好的足球投注网站真空吸尘器世界问题的局部感知:位置传感器和局部垃圾传感器例如:状态1的可观察信息percept(s)=[A,dirty]一个信念状态到另一个信念状态的特定行动分三阶段发生:预测阶段:给定信念状态b和行动a,预测信念状态观察预测阶段:确定预测信念状态中可观察到的感知信息o: 更新阶段:根据每个可能的感知信息得到信念状态 部分可观察信息的有哪些信誉好的足球投注网站部分可观察信息的有哪些信誉好的足球投注网站[Suck,Right,if Bstate={6} then Suck else []]部分可观察信息的有哪些信誉好的足球投注网站部分可观察信息的有哪些信誉好的足球投注网站部分可观察环境中的问题求解Agent形式化,有哪些信誉好的足球投注网站算法,执行解行动解是一个条件规划不是一个序列 if-then-elseAgent在完成行动和接收感知信息时维护自身的信念状态部分可观察信息的有哪些信誉好的足球投注网站UPDATE(PREDICT(UPDATE(b,NSW),Move),NS)联机有哪些信誉好的足球投注网站Agent脱机有哪些信誉好的足球投注网站算法:在行动之间计算好完整的解决方案联机有哪些信誉好的足球投注网站算法:行动,观察环境,下一步行动联机有哪些信誉好的足球投注网站Agent:竞争比竞争比=实际代价/最小代价30/20=1.5竞争比越小越好竞争比可以是无穷大,比如达到某些状态后无法达到目标状态(活动不可逆)可安全探索的状态空间:每个可达到的状态出发都有达到目标状态的行动,如迷宫问题,八数码问题总结局部有哪些信誉好的足球投注网站算法不确定动作的有哪些信誉好的足球投注网站使用部分可观察信息的有哪些信誉好的足球投注网站联机有哪些信誉好的足球投注网站Qa?But just how big these UGCs ar

文档评论(0)

manyu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档