方宝富
- 作品数:98 被引量:163H指数:6
- 供职机构:合肥工业大学更多>>
- 发文基金:国家自然科学基金安徽省自然科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术文化科学自然科学总论理学更多>>
- 稀疏奖励场景下基于状态空间探索的多智能体强化学习算法
- 2024年
- 多智能体的任务场景往往伴随着庞大、多样的状态空间,而且在某些情况下,外部环境提供的奖励信息可能非常有限,呈现出稀疏奖励的特征.现有的大部分多智能体强化学习算法在此类稀疏奖励场景下效果有限,因为算法仅依赖于偶然发现的奖励序列,会导致学习过程缓慢和低效.为了解决这一问题,文中提出基于状态空间探索的多智能体强化学习算法,构建状态子集空间,从中映射出一个状态,并将其作为内在目标,使智能体更充分利用状态空间并减少不必要的探索.将智能体状态分解成自身状态与环境状态,结合这两类状态与内在目标,生成基于互信息的内在奖励.构建状态子集空间和基于互信息的内在奖励,对接近目标状态的状态与理解环境的状态给予适当的奖励,以激励智能体更积极地朝着目标前进,同时增强对环境的理解,从而引导其灵活适应稀疏奖励场景.在稀疏程度不同的多智能体协作场景中的实验验证文中算法性能较优.
- 方宝富余婷婷王浩王在俊
- 关键词:互信息
- 基于螺旋模型的仿人机器人步态参数优化算法被引量:1
- 2018年
- 步行运动是仿人机器人运动控制的关键环节之一.为了实现快速、稳定的步态,在协方差矩阵自适应进化策略(CMA-ES)的基础上,文中提出仿人机器人螺旋模型算法.在步行优化过程中,将优化任务先划分为3个子任务,按照优化目标分别挑选参数加入相应优化组,同时构建CMA-ES优化器.根据不同的学习目标设计每个CMA-ES优化器,在前一优化组优化结果基础上结合新的需求进行螺旋迭代优化,最终达到既定的学习目标,获得最佳参数值.文中算法应用在HfutEngine仿真3D球队中,机器人的相关步态测试数据显示算法效果较佳.
- 李晓雨王浩方宝富
- 关键词:仿人机器人运动控制
- 多智能体的数据评估决策方法、装置、设备及介质
- 本发明公开了一种多智能体的数据评估决策方法、装置、设备及介质,包括:基于第一经验池训练进取心模型,并根据进取心模型确定进取程度,其中,进取心模型用于衡量互信息,推动靠近优秀目标远离差劣结果;基于进取程度构建第二经验池;采...
- 王络方宝富唐丹丹
- 基于情绪感染的情感机器人任务分配算法研究被引量:3
- 2016年
- 在多机器人系统中,任务分配是一个重要的研究课题.文章对任务分配中的机器人情感因素进行研究,提出基于情绪感染的情感机器人任务分配算法.根据OCEAN模型定义情感机器人个性,并结合机器人在情绪感染中行为的不同将个体分为四种类型,定义情感机器人个性到行为的映射,提出情绪感染算法,将情绪感染与任务分配结合.任务分配中首先依据定义的领导能力参数选择团队领导者,然后根据情绪感染机制选择出任务团队中的其他合作成员,形成满足任务需求的团队.最后实验分析了情绪感染模型的影响因素和不同个性机器人个体对一般群体的影响,并验证了本文所提出算法的有效性.
- 方宝富李勇王浩
- 关键词:情感机器人情绪感染情绪模型
- 一种基于相关性分析的燃气轮机故障预测方法
- 本发明公开了一种基于相关性分析的燃气轮机故障预测方法,其步骤包括:1、以流的方式逐个读入待处理的监测节点向量;2、对每个当前读入的监测节点向量,与系统已经进行读入的监测节点向量,进行相关性分析;3、对已经选择的相关监测节...
- 杨静方宝富沈安波樊高金江刘峰朱尤杰
- 基于状态空间与概率空间映射的极大相似度匹配情感模型被引量:3
- 2013年
- 机器人情感建模是研究情感机器人的热点问题.文中以情感心理学知识为基础,模拟具有不同个性的情感机器人在外界刺激作用下情感动态变化的过程,研究个性和外界刺激对情感转移过程的影响.采用基于状态空间的情感空间模型来描述机器人的情感状态,并用HMM过程来模拟情感状态的转移过程.但HMM过程只能求得当前情感状态的概率,为得到具体的情感状态,文中提出一种基于状态空间与概率空间映射的极大相似度匹配的情感转移模型.首先利用HMM过程计算出当前情感概率,然后通过极大相似度匹配来得到转移后具体的情感状态.通过调节模型参数来模拟不同个性和外界刺激,该模型能有效模拟情感状态变化过程.实验结果验证模型模拟的情感变化过程符合人类情感变化的一般规律.
- 王浩张权益方宝富方帅
- 关键词:情感机器人空间映射
- 机器人足球中Agent智能的实现
- Robocup机器人足球是分布式人工智能的一个重要研究平台,其核心内容就是设计实时且具有抗噪音的多Agent系统,具体内容其中包括Agent结构设计、Agent智能的获取以及多Agent之间的协作。本文阐述了Agent是...
- 方宝富王浩姚宏亮杨静
- 关键词:机器人比赛足球机器人人工智能
- 文献传递
- 基于多Agent动态影响图的协作实现被引量:1
- 2007年
- 将MAIDs在时间上进行扩展,提出一种新决策模型——多Agent动态影响图(MADIDs),对动态环境中的协作关系进行建模;给出MADIDs的一种分层分解的分布近似方法,进而通过将决策结点和效用结点的推理引入到BK算法中,给出MADIDs环境模型的一种扩展BK(EBK)近似推理算法;引入一种BP神经网络学习MADIDs的局部效用函数。最后,针对一个表示协作关系的MADID模型,进行算法比较和仿真实验,实验结果显示了MADIDs模型的有效性。
- 姚宏亮王浩张佑生汪荣贵方宝富
- 关键词:多AGENT动态影响图联合树
- 基于点线特征融合的机器人定位与建图方法和装置
- 本申请涉及一种基于点线特征融合的机器人定位与建图方法、装置、计算机设备及存储介质,所述方法包括:通过使用RGB‑D相机进行周边环境探测,采集得到RGB图像和深度图像,并确定连续的图像帧,再从连续的图像帧中提取点特征,并通...
- 方宝富王浩杨静詹志强王乐韩修萌
- 文献传递
- 基于积极团队情感基调的情感机器人协作任务分配拍卖算法被引量:7
- 2020年
- 多机器人系统(Multi Robot System,MRS)通过引入机器人个体情感因素,可以有效提高个体的自主协作能力、决策能力以及多机器人系统的整体智能化水平。然而,以往研究主要集中于个体情感状态(情绪、个性等),缺乏从团队情感层面来探索积极团队情感基调(Positive Group Affective Tone,PGAT)对团队协作能力和团队有效性的影响。为了发挥PGAT在任务分配中的积极作用,降低因为团队成员情绪衰减而导致团队解散的风险,并增加团队协作能力和团队有效性,提出了基于PGAT的情感机器人协作任务分配拍卖算法。仿真追捕对比实验表明,相对于基于焦虑情感模型的改进合同网协议多机器人任务分配算法和基于自主意识的分布式情感机器人任务分配算法,基于PGAT的情感机器人协作任务分配拍卖算法的追捕成功率分别提高了269.3%和6.5%,任务分配成功率分别提高了138.7%和5.1%,平均追捕时间分别缩短了14.5%和26.3%,并且在150场追捕对比实验中,追捕时间小于对比算法的场次占比分别达到87.3%和90.7%。
- 李虎方宝富
- 关键词:多机器人系统情绪