您的位置: 专家智库 > >

许志鹏

作品数:3 被引量:0H指数:0
供职机构:苏州大学更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇专利
  • 1篇学位论文

领域

  • 2篇自动化与计算...

主题

  • 3篇分层强化学习
  • 2篇机器人
  • 2篇复杂环境
  • 2篇初始化
  • 2篇初始化方法
  • 1篇动态环境
  • 1篇学习算法
  • 1篇OPTION

机构

  • 3篇苏州大学

作者

  • 3篇许志鹏
  • 2篇朱斐
  • 2篇伏玉琛
  • 2篇黄蔚

年份

  • 1篇2019
  • 2篇2016
3 条 记 录,以下是 1-3
排序方式:
基于自动发现抽象动作的机器人分层强化学习初始化方法
本发明公开了一种基于自动发现抽象动作的机器人分层强化学习初始化方法,其特征在于:包括Q学习模块、创建抽象动作模块、状态‑抽象动作评估值Q(s,o)初始化模块以及分层强化学习模块,先利用Q学习模块让机器人与环境交互产生经验...
许志鹏朱斐伏玉琛黄蔚
基于自动发现抽象动作的机器人分层强化学习初始化方法
本发明公开了一种基于自动发现抽象动作的机器人分层强化学习初始化方法,其特征在于:包括Q学习模块、创建抽象动作模块、状态‑抽象动作评估值Q(s,o)初始化模块以及分层强化学习模块,先利用Q学习模块让机器人与环境交互产生经验...
许志鹏朱斐伏玉琛黄蔚
文献传递
基于动作抽象的分层强化学习算法研究
强化学习可以通过与环境交互完成自主学习与优化,是一类重要的机器学习方法。然而强化学习也存在若干难点亟待解决,如“维数灾难”问题,在提高算法效果的前提下同时提高算法效率等。作为强化学习中的一个重要领域,分层强化学习将学习任...
许志鹏
关键词:动态环境
共1页<1>
聚类工具0