2024年7月25日
星期四
|
欢迎来到滨州市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
许志鹏
作品数:
3
被引量:0
H指数:0
供职机构:
苏州大学
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
黄蔚
苏州大学
伏玉琛
苏州大学
朱斐
苏州大学
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
2篇
专利
1篇
学位论文
领域
2篇
自动化与计算...
主题
3篇
分层强化学习
2篇
机器人
2篇
复杂环境
2篇
初始化
2篇
初始化方法
1篇
动态环境
1篇
学习算法
1篇
OPTION
机构
3篇
苏州大学
作者
3篇
许志鹏
2篇
朱斐
2篇
伏玉琛
2篇
黄蔚
年份
1篇
2019
2篇
2016
共
3
条 记 录,以下是 1-3
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于自动发现抽象动作的机器人分层强化学习初始化方法
本发明公开了一种基于自动发现抽象动作的机器人分层强化学习初始化方法,其特征在于:包括Q学习模块、创建抽象动作模块、状态‑抽象动作评估值Q(s,o)初始化模块以及分层强化学习模块,先利用Q学习模块让机器人与环境交互产生经验...
许志鹏
朱斐
伏玉琛
黄蔚
基于自动发现抽象动作的机器人分层强化学习初始化方法
本发明公开了一种基于自动发现抽象动作的机器人分层强化学习初始化方法,其特征在于:包括Q学习模块、创建抽象动作模块、状态‑抽象动作评估值Q(s,o)初始化模块以及分层强化学习模块,先利用Q学习模块让机器人与环境交互产生经验...
许志鹏
朱斐
伏玉琛
黄蔚
文献传递
基于动作抽象的分层强化学习算法研究
强化学习可以通过与环境交互完成自主学习与优化,是一类重要的机器学习方法。然而强化学习也存在若干难点亟待解决,如“维数灾难”问题,在提高算法效果的前提下同时提高算法效率等。作为强化学习中的一个重要领域,分层强化学习将学习任...
许志鹏
关键词:
动态环境
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张