- 1、本文档共22页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
BCPS:具有感知行动的双向规划
BCPS:具有感知行动的双向规划算法 BCPS: Bi-direction Conditional Planning with Sensing actions 本文的组织 第1章——概略描述经典规划中,需要解决的问题及其在不完备信息下进行规划所存在的局限,由此引出感知行动和条件规划,并介绍了基于环境空间的规划有哪些信誉好的足球投注网站策略。 第2章——介绍了BCPS的形式化描述,给出了非感知行动、感知行动的形式化描述,并定义了条件规划。 第3章——定义了环境间的正向、反向转移函数。 第4章——详细描述了BCPS的有哪些信誉好的足球投注网站策略,讨论了正向、反向有哪些信誉好的足球投注网站算法,在此基础上给出了双向有哪些信誉好的足球投注网站算法。 第5章——对本文的总结及未来的工作。 经典规划的局限 经典规划基于以下假设:在初始环境中,agent具备规划所需要的全部知识,最后形成的规划是一个简单的行动序列。 上述的假设带有很大的局限性,实际很多情况下,agent对于环境的知识是不完备的,如果一些必要的状态变量值未知,则经典规划无解。因此,需要执行相应的感知行动,获得规划所需的状态信息。 本文提出的双向规划算法BCPS引入了感知行动,算法所得的规划不再是单一的行动序列,而是条件规划。 具有感知行动的规划有哪些信誉好的足球投注网站策略 正向有哪些信誉好的足球投注网站策略:由初始环境到目标环境方向上执行有哪些信誉好的足球投注网站。优点:对行动的可执行条件判断较简单;缺点:规划出现的分支较多,生成的环境空间过大; 反向有哪些信誉好的足球投注网站策略:由目标环境到初始环境方向上执行有哪些信誉好的足球投注网站。优点:规划分支较少;缺点:对行动的可执行条件判断相对较难; 双向有哪些信誉好的足球投注网站策略(本算法):正向、反向有哪些信誉好的足球投注网站不可避免会出现环境指数爆炸问题,双向有哪些信誉好的足球投注网站同时在两个方向上执行有哪些信誉好的足球投注网站。优点:一般情况下,可以避免环境空间的过度扩展;缺点:每一步都需要判断正向、反向所得的条件规划能否构成解,增加了额外的开支。 BCPS规划算法须解决的问题 行动的形式化描述——行动要具有可执行条件、相应的结果说明、相对于该结果的前提条件。 BCPS的语义描述——描述环境间由于行动而发生转移的推理机制,即根据行动的形式化描述,给出行动执行后的结果环境。本文以转移函数进行语义描述,并对非感知行动和感知行动在正向和反向两个方向分别定义环境转移函数。 算法输出解的定义——给出一个条件规划是否为解的判断依据。 算法的有哪些信誉好的足球投注网站策略——双向执行宽度优先有哪些信誉好的足球投注网站策略。 BCPS的形式化描述 1. BCPS规划问题表示由一个四元组表示:P=M,A,I,G, 其中: M为状态的有限集; A为行动的有限集; I为初始环境,可能是不完备的。 G为目标环境。 BCPS的形式化描述(续) 2. 行动描述 本文对非感知行动和感知行动严格区分:非感知行动:不但改变外部环境的状态值,同时也改变agent对于外部环境的认知状态;感知行动:不改变外部环境的状态值,只改变agent对于外部环境的认知程度。 非感知行动由以下ef-命题描述:a causes f if pre(a,f) 感知行动由下述k-命题描述: a senses f if exc(a,f) 行动的可执行条件由以下ex-命题描述: executable a if Poss(a) BCPS的形式化描述(续) 条件规划定义: 空的行为序列,记为[],是条件规划; 若a是非感知行为,则a是条件规划; 若a是感知行为,?1...?n是互斥的状态文字,表示感知行动的感知结果,c1…cn(n0)是条件规划,则以下是条件规划 a;case[?1→c1,…, ?n→cn] 若c1,c2是条件规划,则c1;c2是条件规划; 只有以上是条件规划。 BCPS的语义描述 1. 基本概念 状态——对于真实世界某一属性的谓词描述,状态取值为true,false,unkown; 环境(situation)——所有状态的集合; Agent的环境认知——值为已知的状态集合。简记为k-situ; 为推理上的需要,我们将k-situ表示为??T,F,其中T={f |f?? ,?是k-situ,f是状态文字且已知为真} F={f | f?? ,?是k-situ,f是状态文字且已知为假} 环境的解释 部分解释:给定一个状态集合S,对S的一个部分解释是对S中的某些状态赋值v={true,false},记为I(Q)=TQ,FQ,Q是状态集,且Q?S。 完备解释:给定一个状态集合S,对S的一个完备解释是对S中的每个状态赋值v={true,false},记为I(S)=TS,FS,其中TS∪FS=S, TS∩FS=? 。 BCPS的语义描述(续) 2. 转移函数 正向转移函数:?1=Image(a,?) 在环境?中执行一个行动a,根据该行动的命题描述a causes f if pre(a,f),计算行动a执行后的结果环境?1,行动a执行的
文档评论(0)