刘旭红
- 作品数:57 被引量:231H指数:7
- 供职机构:北京信息科技大学更多>>
- 发文基金:国家自然科学基金北京市重点实验室开放基金北京市属高等学校人才强教计划资助项目更多>>
- 相关领域:自动化与计算机技术文化科学矿业工程电子电信更多>>
- 分类任务中标签噪声的研究综述被引量:2
- 2022年
- 近年来,随着机器学习的发展,分类系统的性能有了很大的飞跃。模型需要大量带标签数据才能使训练结果达到要求,而获取高质量的标注数据费时费力。为了降低成本,出现了众包、自动化系统等方法标注训练数据。但是,这些标注方法往往会产生大量错误标注,即标签噪声。另外,信息不足、专家错误和编码错误等因素,也可能使标签受到污染。训练过程中对标签噪声的处理不当,可能会使预测精度和准确性降低,或者使模型复杂度增加。因此,研究标签噪声对推广机器学习在各领域的应用和降低机器学习算法的部署成本等方面具有重要意义。通过综述产生标签噪声的原因、影响以及近几年来应对标签噪声的一些技术方法,对标签噪声的研究现状和发展前景进行分析。
- 佟强刁恩虎李丹谌彤童刘旭红刘秀磊
- 智能文档操作界面的UIML描述方法被引量:2
- 2014年
- 从智能文档的概念产生开始到现在,出现了不同的相关产品和研究成果,但是它们在灵活性、可重用性、跨平台等方面存在缺陷。针对这些问题,建立了基于UIML的智能文档模型,模型采用MVC架构,应用用户界面描述语言UIML描述智能文档的操作界面。解析器解析UIML文档,获得界面控件信息及事件响应,并生成动态操作界面。基于模型,建立了一个原型系统,对系统进行了用例测试,测试结果验证了模型的可行性和正确性。
- 施运梅李宁刘旭红
- 关键词:智能文档用户界面
- DITA-OT中音乐元素域的扩展方法研究被引量:1
- 2013年
- 为扩展DITA-OT对音乐的支持能力,使之更好地适用于复合出版领域,提出了一种在DITA-OT中扩展音乐元素域的方法。通过元素域专门化,将MusicXML中的元素扩展到DITA-OT中,以便DITA-OT能够识别MusicXML中的元素,并建立专门的转换程序支持专门化过程。为验证方法的正确性,构建了一个包含MusicXML元素的DITA文档,运用上述方法对此文档实现了到XHTML和MIDI格式的正确转换。实验结果验证了DITA-OT中音乐元素域扩展方法的可行性和有效性。
- 刘鹏施运梅李宁刘旭红
- 关键词:复合出版
- 机器学习设计新型有机分子研究进展被引量:1
- 2021年
- 新型有机分子一直是有机化学领域的研究重点,其在开发高性能材料方面具有重要意义.传统的有机分子发现是一个类似于“炒菜”的试错过程,它耗时耗能且效率相对低下.常见的量子化学方法试图根据期望属性值筛选出合理的分子结构,以更好地指导实验,然而,由于计算资源相对于算法复杂度严重不足,精确给出实验指导在大多数情况下难以实现.近年来机器学习的出现改变了这种情况,训练好的模型可以快速推测出分子的属性.更令人兴奋的是机器学习可以逆向进行分子设计,拓宽人类的想象力,给出其在分子设计领域的“神之一手”.本综述首先介绍了逆向分子设计所必须的分子描述方式,随后对几种常见的深度生成模型加以归纳,对新型有机分子设计研究现状进行了总结,最后探讨了新型有机分子设计所面临的挑战,展示了笔者做出的部分探索.
- 谭胖刘旭红谌彤童秦智慧杨涛刘晓彤刘秀磊
- 关键词:BASE64编码
- 一种煤矿安全事故本体概念抽取方法
- 本发明提供了一种煤矿安全事故本体概念抽取方法,该方法将词向量和条件随机场结合起来对煤矿安全事故本体概念进行抽取,充分考虑领域词语的语义特性和领域特性,解决了传统研究方法在语义关系分析方面欠缺的问题以及煤矿安全领域数据管理...
- 刘秀磊刘思含刘旭红李红臣崔展奇
- 文献传递
- 一种基于双向MGU神经网络的关系抽取方法
- 本发明提供一种基于双向MGU神经网络的关系抽取方法。解决了单向MGU模型对后文依赖性不足,无法处理后文信息的问题。通过实验表明了该方法的训练时间更短,抽取准确率、召回率和F值更高。通过分析不同关系类型的抽取性能,发现了关...
- 刘旭红张良刘秀磊李臻陈雨婷
- 基于深度学习的煤矿领域实体关系抽取研究被引量:5
- 2019年
- 关系抽取是构建知识图谱的一个重要过程。为了更好地构建煤矿领域知识图谱,本文对关系抽取的方法进行研究。传统关系抽取方法在训练前多需要人工选取特征、大量标注数据、且需要专业领域的专家辅助、费时费力、且成本较高。本文采用字向量和深度学习相结合的方法对实体间的关系进行抽取,降低数据标注的难度,提高训练效率。实验结果证明使用字向量与深度学习相结合的方法能够较有效地完成煤矿领域实体关系抽取的任务。
- 杜嘉刘思含李文浩徐啸迪刘旭红
- 关键词:关系抽取知识图谱循环神经网络
- 字体相似度及字体替换方法
- 本发明涉及一种字体相似度和字体替换方法,包括:步骤1、根据预设的影响字体视觉效果的属性值,分别构造汉字文本块图像,以生成汉字文本块图像样本库;其中所述汉字文本块图像包括n×n个不交叠的汉字,其中n≥2;步骤2、计算汉字文...
- 刘旭红李宁赵欢
- 文献传递
- 基于显著性检测和迁移学习的花卉图像分类被引量:6
- 2019年
- 针对传统花卉分类方法和普通卷积神经网络很难将花卉背景的影响降低分类效果不理想的问题,提出一种将显著性检测和迁移学习相结合的方法。通过背景先验显著性的方法确定花卉区域,将花卉分割方法和基于迁移学习的深度神经网络分类方法结合,将训练迁移的InceptionV3网络用于花卉图像,利用训练好的网络模型对花卉图像进行分类。在国际公开花卉识别数据集Oxford flower-102上的实验表明:该模型比改进的Alex网络分类准确率高7.63%,且比未进行分割的花卉图像进行网络训练的模型准确率高2.85%,分类准确率达到了93.38%。
- 吴迪刘秀磊侯凌燕刘旭红李红臣
- 关键词:显著性检测图像分类
- 基于社会特征的注意力行人轨迹预测模型研究
- 2020年
- 针对社会性长短期神经网络行人交互仅依靠空间位置,不符合实际情况的问题,提出一种通过行人之间距离、角度等三项特征,提取社会特征,并引入注意力模块的行人轨迹预测模型,以提高模型对行人之间交互的刻画,实验表明本文提出的方法能够提高行人轨迹预测的准确率。
- 苗存远王兴鞠蕊浓刘旭红