您的位置: 专家智库 > >

国家重点实验室开放基金(SKVR-KF-09-04)

作品数:2 被引量:3H指数:1
相关作者:余雪丽胡坤李誌李志更多>>
相关机构:太原理工大学更多>>
发文基金:山西省自然科学基金国家重点实验室开放基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇分层强化学习
  • 1篇多AGENT...
  • 1篇神经网
  • 1篇神经网络
  • 1篇网络
  • 1篇BP神经
  • 1篇BP神经网
  • 1篇BP神经网络
  • 1篇博弈
  • 1篇博弈模型

机构

  • 2篇太原理工大学

作者

  • 2篇胡坤
  • 2篇余雪丽
  • 1篇李誌
  • 1篇李志

传媒

  • 1篇计算机工程与...
  • 1篇计算机工程与...

年份

  • 1篇2012
  • 1篇2011
2 条 记 录,以下是 1-2
排序方式:
一种改进的自动分层算法BMAXQ被引量:1
2011年
针对MAXQ算法存在的弊端,提出一种改进的分层学习算法BMAXQ。该方法修改了MAXQ的抽象机制,利用BP神经网络的特点,使得Agent能够自动发现子任务,实现各分层的并行学习,适应动态环境下的学习任务。
胡坤余雪丽李志
关键词:分层强化学习BP神经网络
基于半马氏博弈模型的分层强化学习研究被引量:2
2012年
针对多Agent强化学习研究中面临的非马尔可夫环境和维数灾难问题,提出了一种半马氏博弈模型和MAHRL(multi-agent hierarchical reinforcement learning)协同框架。该模型弱化了系统对外界环境的要求,引入了随机时间步和通信策略的概念,更符合MAHRL研究的实际情况;协同框架中分别用SMG和SMDP模型对不同子任务进行建模,明确了Agent之间的协同机制。通过实验证明了SMG模型和协同框架的有效性和优越性。
李誌胡坤余雪丽
关键词:多AGENT强化学习分层强化学习
共1页<1>
聚类工具0