2025年1月9日
星期四
|
欢迎来到滨州市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
国家重点实验室开放基金(SKVR-KF-09-04)
作品数:
2
被引量:3
H指数:1
相关作者:
余雪丽
胡坤
李誌
李志
更多>>
相关机构:
太原理工大学
更多>>
发文基金:
山西省自然科学基金
国家重点实验室开放基金
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
相关作品
相关人物
相关机构
相关资助
相关领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
2篇
中文期刊文章
领域
2篇
自动化与计算...
主题
2篇
分层强化学习
1篇
多AGENT...
1篇
神经网
1篇
神经网络
1篇
网络
1篇
BP神经
1篇
BP神经网
1篇
BP神经网络
1篇
博弈
1篇
博弈模型
机构
2篇
太原理工大学
作者
2篇
胡坤
2篇
余雪丽
1篇
李誌
1篇
李志
传媒
1篇
计算机工程与...
1篇
计算机工程与...
年份
1篇
2012
1篇
2011
共
2
条 记 录,以下是 1-2
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
一种改进的自动分层算法BMAXQ
被引量:1
2011年
针对MAXQ算法存在的弊端,提出一种改进的分层学习算法BMAXQ。该方法修改了MAXQ的抽象机制,利用BP神经网络的特点,使得Agent能够自动发现子任务,实现各分层的并行学习,适应动态环境下的学习任务。
胡坤
余雪丽
李志
关键词:
分层强化学习
BP神经网络
基于半马氏博弈模型的分层强化学习研究
被引量:2
2012年
针对多Agent强化学习研究中面临的非马尔可夫环境和维数灾难问题,提出了一种半马氏博弈模型和MAHRL(multi-agent hierarchical reinforcement learning)协同框架。该模型弱化了系统对外界环境的要求,引入了随机时间步和通信策略的概念,更符合MAHRL研究的实际情况;协同框架中分别用SMG和SMDP模型对不同子任务进行建模,明确了Agent之间的协同机制。通过实验证明了SMG模型和协同框架的有效性和优越性。
李誌
胡坤
余雪丽
关键词:
多AGENT强化学习
分层强化学习
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张