人工智慧--chap2 PPT.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人工智慧--chap2 PPT

* 第二章 智慧型代理人 Intelligent Agents * 第2章 智慧型代理人 本章所學內容 2.1 代理人和環境 2.2 好的行為表現: 理性的概念 2.3 環境的本質 2.4 代理人的結構 2.5 小 結 * 2.1 代理人和環境 任何能夠以感測器去覺察環境,並且以作用器(effector) 對環境作用的東西都可以稱為代理人。 人類代理人有眼睛,耳朵,以及其他器官做為感測器,還有手,腳,嘴巴以及其他身體各部位做為作用器。 一個機器代理人則是以相機及紅外偵測器做為感測器,並且有不同的馬達做為作用器。軟體代理人有編碼的位元字串來覺知及動作。 代理人的績效如何衡量? ( 標準、時機、合理性) * 2.1 代理人和環境 Agent 感測器Sensors ? 執行器Actuators 感知Percepts 行動Actions 環境 Environment 圖2.1 代理人以感測器及執行器與環境作用 * 例子:吸塵器世界 位置:左右兩個位置 狀態:有或沒有灰塵 操作:左移(Left)、右移(Right)、吸塵(Suck) 目標:塵埃吸乾淨 感應器:位置感應器,局部灰塵感應器 感知(Percepts) :位置與內容, e.g., [A, Dirty] 動作(Action): Left, Right, Suck, NoOp * 2.2 好的行為表現:理性的概念 用績效衡量來當作決定代理人有多成功的準則。 沒有一種固定的衡量是適合所有代理人的。 ~例子~ 假設一個情況是代理人要把髒地板用吸塵器掃乾淨 績效衡量的方式: 八小時後檢查掃起來的灰塵量算是一個似乎合理的方式, 比較做作的方式是把耗電量和產生的噪音也一併考慮進來, 要求最高的方式,則是要求代理人不只是安靜的、有效率的把地板打掃乾淨,週末還要空出時間來從事衝浪運動。 * 合理性及全知 分辨『合理性』及『全知』(上帝)的不同要非常地小心。 全知的代理人知道動作的實際代價,能夠據此決定其行動。但在真實環境中全知是不可能的。 合理性僅關心那些假設已覺察到、預期中的成功。 任何一個給定的時間裡,所謂的合理,和下列四件事相關: 定義成功度的效能衡量。 到目前為止代理人覺察到的每一件事。 我們稱這整個感知的歷史過程為感知序列。 代理人對環境的認識。 代理人能夠執行的動作。 * 理想的合理性代理人 定義: 對於每一個可能的感知序列,一個理想的合理性代理人,應該在感知序列提供的證據及內建知識的基礎上,執行預期能夠使績效衡量結果最佳化的動作。 理想對應: 1.代理人的行為和目前的感知序列相關,只要列出代理人回應感 知序列所採取的行動表,就可以描述任何一個特定代理人。 這表格稱之為從感知序列到動作的對應。 2.從所有可能的感知序列及記錄代理人回應的動作,可以找出正 確描述代理人的對應。對應可以說明代理人,而理想的對應就 描述了理想的代理人。 3.一個明確的列表,可以用來登記每一個可能的感知序列。 * 自主性 理想合理性代理人的另一個定義:就是『內建知識』。如果代理人的行動完全基於內建知識,而完全不注意感知,則我們說這個代理人缺乏自主性。 提供一個人工智慧代理人某些起始知識及學習能力是合理的。 ~例子~ 假如鐘錶製造商有先見之明,預知錶主將在某特定日子前往澳洲,則可以在錶內內建一個機制,在那個時間自動把時針調整六個小時。這將是相當成功的動作,但是智慧性看起來是屬於錶的設計人而非錶本身。 * 2.3 環境的本質 代理人結構:硬體,提供程式來自感測器的感知,執行程式,將程式產生的動作選擇回授給執行器。f : P* ? A 代理人程式:人工智慧的工作,實現代理人從感知到動作相符的功能。 PEAS(績效Performance measure , 環境Environment, 執行器Actuators, 感測器Sensors) 目標描述代理人設計所需的績效衡量。 人工環境:以鍵盤輸入及螢幕輸出的符號來定義; 真實環境:機器人檢驗通過輸送帶上的零件,其環境假設照明會一直正常,輸送帶上只會有特定種類的零件,也只會有零件通過檢驗或不通過的兩種動作。 * 例子:計程車自動駕駛系統PEAS描述 代理人型態 效能指標 環境 執行器 感測器 計程車司機 安全,快速,合法,舒適的旅程,最大獲利 道路,其他車輛,行人,乘客 方向盤,油門,煞車,信號燈,喇叭,顯示器 攝影機,聲納,速度表,GPS,里程表, 加速計,引擎感測器,鍵盤 不同的駕駛會產生不同類型的代理人: 簡單反射式代理人: 條件-動作規則 與世界保持聯繫代理人:記憶體記憶及更新世界狀態

您可能关注的文档

文档评论(0)

djdjix + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档