- 1、本文档共69页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Agent 的开发与应用
ii
第一章 序论
摘 要
多 Agent 系统的理论与技术已成为分布式人工智能和计算机科学技术重
要研究内容之一。由于多Agent系统的运行环境大型、开放、动态和不确定,迫
切需要采用各种智能技术, 引入学习机制来构建具有自学习能力的Agent。
本文主要研究Agent系统中的机器学习方法,通过对各种机器学习方法的研
究与改进,力图使Agent的学习能力更强,适应性更好。本文的主要研究成果和
创新之处体现在以下几个方面:
(1) BP 算法是神经网络中最常用的算法之一。标准BP算法存在的最主要问
题就是易于陷入局部极小、收敛速度慢等问题。针对BP 算法的这些问题,出现
了许多改进的措施,如引入变步长法、加动量项法等。本文提出了一种基于样
本期望训练数的改进BP算法(EBP),仿真实验说明了该算法可以明显提高BP网络
学习速度,并且具有简单通用性,可以和其他方法结合,进一步提高算法的收
敛速度。
(2)本文结合免疫机制和数论中的佳点集理论,给出了一种免疫佳点集遗
传算法(IGGA)。该算法把数论中佳点集理论运用于遗传算法交叉操作和种群初
始化的改进,提出带权欧氏距离计算抗体的相似度、浓度和适应度,引入免疫
机制使群体保持多样性和快速导向高适应度模式。实验结果验证了该算法可以
有效地避免早熟,改善算法的全局收敛性,提高有哪些信誉好的足球投注网站效率。
(3)强化学习中的Q学习是一种基于随机动态过程的不依赖模型的学习方
法,Q学习主要采用查询功能代替Q函数。但由于当数量较大时Q 值需要很大的
存储空间,同时agent 所处的环境是空间连续的,因此采用本文提出的改进的神
经网络用来来拟合Q 函数,来处理连续状态和连续动作,并运用到RoboCup 比赛
这一典型多智能体环境中去。仿真结果表明,改进的EBP-Q学习方法可以较快地
获得成功学习策略。
国际机器人世界杯仿真比赛系统是人工智能和机器人研究的集中体现,他
的仿真比赛环境融合了多种机器学习内容,是检验机器学习方法有效性的一个
非常理想的平台,本文研究的机器学习方法都在这个平台上进行了仿真实验,
取得了较好的学习策略。
关键词:智能体、机器学习、期望训练数、免疫佳点集遗传算法、RoboCup
i
Agent 的开发与应用
ABSTRACT
The research on Multi-Agent System is an important branch of in the artificial
intelligence and computer sicience. The environment of Multi-Agent System is very
large, open, dynamic and uncertain, so its urgent to introduce learning mechanism
and techniques from artificial intelligence to build intelligent agent with self-learning
ability.
This dissertation mainly discusses machine learning methods of Multi-Agent
System. It tries to make learning more robust and more adaptable through the
research. The main research work and contributions of this dissertation are as follows:
(1) BP algorithm is one of the most widely used algorithms in neural
您可能关注的文档
- 大学生考试作弊成因及对策研讨.pdf
- 堆疊顆粒表面正紋理深度總和與摩擦力之關聯性分析研究.pdf
- 大学生考试作弊成因及防范对策研究.pdf
- 堆垛技术在宝钢厚板生产中的应用研究.pdf
- 基于人工神经网络的渭河下游洪水预报研究.pdf
- 大学生科技创新实践基地体系研讨.pdf
- 大学生科技创新项目过程管理研讨.pdf
- 单、二、三乙醇胺混合液的气相色谱分析研究.pdf
- 单、双、三季戊四醇的合成研究.pdf
- 大学生科学宗教观教育的理论依据与可行性选择——以马克思主义宗教观为视角研究.pdf
- 东海证券-轮胎行业月报:2024年高景气收官,节后开工恢复性提升.pdf
- 东吴证券-环保行业跟踪周报:欧盟终裁略下调对华生柴反倾销关税,开始跟踪SAF进口,持续推荐现金流资产.pdf
- 北京博观众智信息科技-日本保健品行业繁荣发展的背后及发展现状.pdf
- 兴业证券-电力设备行业深度报告:机器人业务打开锂电精密加工企业成长空间.pdf
- 信达证券-航空运输月度专题:1月油汇向好、国内线运力同比微增,客座率高位维稳.pdf
- 兴业证券-德昌股份-605555-家电汽零双轮驱动,多元布局兑现高成长.pdf
- 东吴证券-九方智投控股-09636.HK-基本面夯实乘A股东风,AI赋能拓成长蓝海.pdf
- 民生证券-计算机行业深度报告:DeepSeek系列报告之AI+医疗.pdf
- 兴业证券-基础化工行业周报:国常会研究提振消费及化解重点产业结构性矛盾继续关注化工核心资产及新材料成长.pdf
- 国金证券-A股投资策略周报:港股“狂飙”背后:哪些驱动因子与A股不一样?.pdf
文档评论(0)