网站大量收购闲置独家精品文档,联系QQ:2885784924
  1. 1、本文档共21页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2.智能Agent剖析

* * * * * * * * * 人工智能 第二章 智能Agent 第二章 智能Agent 2.1 Agent与环境 2.2 好的行为:理性的概念 2.3 环境的性质 2.4 Agent的结构 * * * 2.1 Agent与环境 * 感知序列、Agent函数、 Agent程序 Agent函数:把任意给定感知序列映射到Agent行动 Agent程序:Agent函数的具体实现 感知序列 行动 [A, Clean] [A, Dirty] [B, Clean] [B, Dirty] … Right Suck Left Suck … 只有两个地点的真空吸尘器 * Agent与环境 Agent :通过传感器感知所处环境并通过执行器对该环境产生作用的计算机程序及其控制的硬件 感知信息:表示任意给定时刻Agent的感知输入 / 感知序列:该Agent所收到的所有输入数据的完整历史 Agent函数:把任意给定感知序列映射到Agent行动的描述 / Agent程序:抽象的Agent函数的一个具体实现,该程序在Agent自身结构上运行 * 2.2 好的行为:理性的概念 理性Agent :“做事正确”的Agent 性能度量:通常由理性设计者给出,根据实际在所处的环境中希望得到的结果来设计度量,而不是根据Agent应该表现的行为。 理性的判断取决于: 性能度量 Agent对环境的先验知识 Agent可执行的行动 Agent到那时为止的感知序列 理性Agent的定义:对每个可能的感知序列,根据已知的感知序列提供的证据和Agent具有的先验知识,理性Agent应该选择期望能使其性能度量最大化的行动。 * 全知者、学习和自主性 理性vs.全知 理性是使期望的性能最大化,而一个全知的Agent知道它的行动产生的实际结果并且作出相应的动作。 信息搜集有助于最大化期望性能,它是理性的重要组成部分。 我们需要Agent尽可能多地从它所感知的东西中学习,即它应该是自主的,以弥补不全面或不正确的先验知识。 * 2.3 环境的性质 建造理性Agent的综合考虑: 任务环境 PEAS (Performance, Environment, Actuators, Sensors) 性能/环境/执行器/传感器 例子 Agent种类 性能度量 环境 执行器 传感器 出租车司机 安全,快速,守法,舒适的旅途,利润最大化 道路,其他车辆,行人,旅客 方向盘,加速器,刹车,信号灯,喇叭,(显示器) 引擎传感器,速度计,加速计,里程计, GPS,(声波传感器,摄像头,键盘) * 任务环境 Agent类型 性能度量 环境 执行器 传感器 医学诊断系统 恢复健康的病人,费用最小化,最少诉讼 病人,医院,职员 显示:问题,测试,诊断,治疗,咨询 键盘输入,症状,检查结果,病人回答 挑拣零件的机器人 放进正确箱子的零件的百分比 载有零件的传送带,箱子 有关节的胳膊和手 摄像头,关节角度传感器 交互式英语教师 最大化学生的测试成绩 学生集合,测验机构 显示(语音合成):练习,建议,纠正 键盘输入(语音识别) * 任务环境的性质 完全可观察的 vs 部分可观察的: 如果Agent在每个时间点都能获取环境的完整状态,称环境是完全可观察的 单Agent vs 多Agent 什么样的实体需要被视为Agent? 确定的 vs 随机的: 如果环境的下一个状态完全取决于当前状态和Agent的动作,则称环境是确定的。否则环境是随机的。 任务环境的性质(2) 片段式的 vs 延续式的: 片段式任务环境中,Agent的经历被分成一个个原子片段; 挑拣零件机器人是片段式的,其决策只需建立在当前零件基础上; 静态的 vs 动态的: 如果环境在Agent计算时发生变化,则称是动态的 出租车驾驶是动态的, 填字谜游戏则是静态的 离散的 vs 连续的: 环境状态、时间的处理方式及Agent的感知信息及行动 下棋是离散的, 驾驶汽车是连续的 * 任务环境的例子 任务环境 可观察性 确定性 片段性 静态性 离散性 Agent数 出租车驾驶 部分 随机的 延续式的 动态的 连续的 多 医学诊断系统 部分 随机的 延续式的 动态的 连续的 单 选零件的机器人 部分 随机的 片段式的 动态的 连续的 单 交互式英语教师 部分 随机的 延续式的 动态的 离散的 多 纵横字谜游戏 完全 确定的 延续式的 静态的 离散的 单 * 2.4 Agent的结构 AI的任务是设计Agent程序, Agent程序要要在某个具备实际传感器和执行器的计算装置上运行, 该装置称为体系结构 Agent = 体系结构 + 程序 通常, Agent程序具有这样的框架: 从传感器得到当前感知信息作为输入, 返回一个行动交给执行器 * Agent类型

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档