陆鑫
- 作品数:20 被引量:403H指数:3
- 供职机构:南京大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术环境科学与工程理学一般工业技术更多>>
- 一种自适应概率规划规则抽取算法被引量:3
- 2003年
- 在已知状态迁移条件下,利用传统概率规划技术能够获得确定的规划规则.而强化学习技术能够在未知环境条件下,利用试错和奖赏函数在线学习动态环境的策略知识.因此一种自适应的概率规划规则抽取算法被提出.该算法首先在强化学习获得的最优状态-动作对值函数基础上,通过迭代得到有折扣无奖赏的值函数和无折扣无奖赏的值函数.然后通过子规划剪枝将大于指定规划步数的子规划去除,并得到子规划剪枝后的状态-动作对值函数.最后通过Beamsearch算法从值函数中抽取满足概率规划条件的规划知识,从而在规划模型变化的条件下.也可以获得确定的概率规划规则.实验证明,这种自适应概率规划规则抽取算法是有效的.
- 高阳陆鑫李宁陈世福
- 关键词:自适应值函数
- 一种基于强化学习的学习Agent被引量:44
- 2001年
- 强化学习通过感知环境状态和从环境中获得不确定奖赏值来学习动态系统的最优行为策略 ,是构造智能Agent的核心技术之一 .在面向 Agent的开发环境 AODE中扩充 BDI模型 ,引入策略和能力心智成分 ,采用强化学习技术实现策略构造函数 ,从而提出一种基于强化学习技术的学习 Agent.研究 AODE中自适应 Agent的结构和运行方式 ,使智能 Agent具有动态环境的在线学习能力 ,并能够有效地满足 Agent各种心智要求 .
- 李宁高阳陆鑫陈世福
- 关键词:心智模型AGENT人工智能
- 一种耐高浓度硫酸盐的高效厌氧反应器及其处理废水的方法
- 本发明公开了一种耐高浓度硫酸盐的高效厌氧反应器及其处理废水的方法,属于污水生物处理技术领域。本发明旨在提供一种高效、稳定、抗硫化氢毒性冲击的厌氧反应器,本发明的高效厌氧反应器包括内循环厌氧反应器,还包括导气管、回流气管、...
- 刘波丁新春李爱民周德超陆鑫王德朋
- 一种污水同步脱氮除磷的改性沸石有机物复合剂及其制备方法、应用和应用方法
- 本发明公开了一种污水同步脱氮除磷的改性沸石有机物复合剂及其制备方法、应用和应用方法,属于废水处理领域。本发明用十六烷基三甲基溴化铵和氯化镧混合溶液作为改性溶液对沸石进行改性,然后将改性的沸石与聚合氯化铝铁(PAFC)以不...
- 刘波侯翔宇陆鑫丁新春王德鹏姚芳李睿华周德超
- 文献传递
- 一种检测污水中亚硝酸盐氧化菌群落结构和丰度的方法
- 本发明公开一种测污水中亚硝酸盐氧化菌群落结构和丰度的方法,具体步骤为:(a)提取污水中活性污泥的全部基因组DNA;(b)分别对nxrA基因和nxrB基因进行PCR扩增;(c)以罗氏454焦磷酸测序法分别对扩增产物进行测序...
- 刘波王德朋陆鑫丁新春侯翔宇姚芳周德超李爱民李睿华
- 文献传递
- 一种污水同步脱氮除磷的改性沸石有机物复合剂及其制备方法、应用和应用方法
- 本发明公开了一种污水同步脱氮除磷的改性沸石有机物复合剂及其制备方法、应用和应用方法,属于废水处理领域。本发明用十六烷基三甲基溴化铵和氯化镧混合溶液作为改性溶液对沸石进行改性,然后将改性的沸石与聚合氯化铝铁(PAFC)以不...
- 刘波侯翔宇陆鑫丁新春王德鹏姚芳李睿华周德超
- 多Agent系统中强化学习技术及其应用的研究
- Agent和多Agent系统的理论是分布式人工智能的重要研究内容之一。主动性是Agent应具备的主要特征,对于处于不断变化的,复杂的外部环境之中的Agent和多Agent系统来说,必须具有学习能力,以适应自身所处的动态环...
- 陆鑫
- 关键词:分布式人工智能机器人足球
- 文献传递
- 强化学习研究综述被引量:336
- 2004年
- 强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支.该文首先介绍强化学习的原理和结构;其次构造一个二维分类图,分别在马尔可夫环境和非马尔可夫环境下讨论最优搜索型和经验强化型两类算法;然后结合近年来的研究综述了强化学习技术的核心问题,包括部分感知、函数估计、多agent强化学习,以及偏差技术;最后还简要介绍强化学习的应用情况和未来的发展方向.
- 高阳陈世福陆鑫
- 关键词:函数估计
- 基于改进二元决策树的多路选择器优化方法及系统
- 本申请提供一种基于改进二元决策树的多路选择器优化方法及系统,所述方法可以在获取到目标硬件描述文件和面积延迟信息后,在目标硬件描述文件中提取地址矩阵和数据矩阵。其中,地址矩阵用于表征目标多路选择器中选择端的数据参数,数据矩...
- 杜力花军勇徐航陆鑫杜源
- 一种生化污泥膨胀控制系统及其控制方法
- 本发明公开了一种生化污泥膨胀控制系统及其控制方法,属于污水生物处理技术领域,本发明包括进水口、二沉池和出水口,所述的二沉池的底端出口连接有污泥回流管道,按污泥回流管道内的流向,上述的污泥回流管道上依次安装有污泥回流泵、剪...
- 刘波丁新春李爱民周德超陆鑫王德朋
- 文献传递