您的位置: 专家智库 > >

中国博士后科学基金(200902483)

作品数:2 被引量:3H指数:1
相关作者:陈鑫吴敏袁姣红戴朝晖更多>>
相关机构:中南大学更多>>
发文基金:中国博士后科学基金国家教育部博士点基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇会议论文

领域

  • 3篇自动化与计算...

主题

  • 3篇智能体
  • 2篇智能体系统
  • 2篇多智能
  • 2篇多智能体
  • 2篇多智能体系
  • 2篇多智能体系统
  • 1篇多代理
  • 1篇多代理系统
  • 1篇学习算法
  • 1篇高斯
  • 1篇贝叶斯
  • 1篇贝叶斯学习
  • 1篇MULTI-...
  • 1篇Q学习
  • 1篇Q学习算法
  • 1篇APPROX...
  • 1篇COOPER...

机构

  • 2篇中南大学

作者

  • 1篇戴朝晖
  • 1篇袁姣红
  • 1篇吴敏
  • 1篇陈鑫

传媒

  • 1篇控制理论与应...
  • 1篇Contro...

年份

  • 1篇2013
  • 1篇2012
  • 1篇2011
2 条 记 录,以下是 1-3
排序方式:
Cooperative learning with joint state value approximation for multi-agent systems被引量:1
2013年
This paper relieves the'curse of dimensionality' problem, which becomes intractable when scaling reinforcement learning to multi-agent systems. This problem is aggravated exponentially as the number of agents increases, resulting in large memory requirement and slowness in learning speed. For cooperative systems which widely exist in multi-agent systems, this paper proposes a new multi-agent Q-learning algorithm based on decomposing the joint state and joint action learning into two learning processes, which are learning individual action and the maximum value of the joint state approximately. The latter process considers others' actions to insure that the joint action is optimal and supports the updating of the former one. The simulation results illustrate that the proposed algorithm can learn the optimal joint behavior with smaller memory and faster learning speed compared with friend-Q learning and independent learning.
Xin CHENGang CHENWeihua CAOMin WU
关键词:多代理系统多智能体系统Q学习算法
基于概率模型的动态分层强化学习被引量:2
2011年
为解决大规模强化学习中的"维度灾难"问题,克服以往学习算法的性能高度依赖于先验知识的局限性,本文提出一种基于概率模型的动态分层强化学习方法.首先基于贝叶斯学习对状态转移概率进行建模,建立基于概率参数的关键状态识别方法,进而通过聚类动态生成若干状态子空间和学习分层结构下的最优策略.仿真结果表明该算法能显著提高复杂环境下智能体的学习效率,适用于未知环境中的大规模学习.
戴朝晖袁姣红吴敏陈鑫
关键词:贝叶斯学习智能体
基于高斯回归的连续空间多智能体最佳响应策略学习
在多智能体的实际应用环境中,泛化往往是多智能体策略学习算法应用于连续状态空间需要解决的关键问题之一本文提出一种基于高斯回归的连续空间多智能体最佳响应策略学习算法该算法通过定义降维的Q函数强调学习智能体对其它智能体策略的适...
魏海军陈鑫吴敏曹卫华
关键词:多智能体系统
文献传递
共1页<1>
聚类工具0