刘旭红
- 作品数:62 被引量:242H指数:7
- 供职机构:北京信息科技大学更多>>
- 发文基金:国家自然科学基金北京市重点实验室开放基金北京市属高等学校人才强教计划资助项目更多>>
- 相关领域:自动化与计算机技术文化科学矿业工程理学更多>>
- 分类任务中标签噪声的研究综述被引量:3
- 2022年
- 近年来,随着机器学习的发展,分类系统的性能有了很大的飞跃。模型需要大量带标签数据才能使训练结果达到要求,而获取高质量的标注数据费时费力。为了降低成本,出现了众包、自动化系统等方法标注训练数据。但是,这些标注方法往往会产生大量错误标注,即标签噪声。另外,信息不足、专家错误和编码错误等因素,也可能使标签受到污染。训练过程中对标签噪声的处理不当,可能会使预测精度和准确性降低,或者使模型复杂度增加。因此,研究标签噪声对推广机器学习在各领域的应用和降低机器学习算法的部署成本等方面具有重要意义。通过综述产生标签噪声的原因、影响以及近几年来应对标签噪声的一些技术方法,对标签噪声的研究现状和发展前景进行分析。
- 佟强刁恩虎李丹谌彤童刘旭红刘秀磊
- “卓越计划+信创”环境下“网络工程项目综合实践”教学模式探索
- 2025年
- “卓越工程师计划”旨在增强学生的工程意识、实践能力和创新能力,使其成为具备专业知识、实践经验和创新精神的卓越应用型工程师。“信息技术应用创新”则是一项国家战略,聚焦信息技术领域的自主可控,以应对外部技术垄断与风险。在此背景下,文章以“卓越工程师计划”为指导,将“信息技术应用创新”相关技术与方向融入课堂,探索“网络工程项目综合实践”课程教学模式改革,提升学生在信创环境下的工程实践能力,从而满足市场对信创技术人才的需求。
- 刘旭红焦健徐英慧殷波郭东超
- 关键词:卓越工程师计划教学模式探索
- 基于知识图谱的北京旅游智能问答系统设计
- 2025年
- 为帮助旅客更好地了解北京的旅游景点信息,开发了一个基于知识图谱的智能问答系统。利用大模型技术辅助提取景点实体、属性及实体间关系,从而构建北京景点的知识图谱;基于AC自动机识别用户问句中的实体,并通过设定的模板和提问词识别用户意图,再查询知识图谱,结合回复模板返回相应的问答结果。
- 车东阳刘旭红邹燃徐楷博孔祥旭朱鑫悦
- 关键词:知识图谱问答系统
- 智能文档操作界面的UIML描述方法被引量:2
- 2014年
- 从智能文档的概念产生开始到现在,出现了不同的相关产品和研究成果,但是它们在灵活性、可重用性、跨平台等方面存在缺陷。针对这些问题,建立了基于UIML的智能文档模型,模型采用MVC架构,应用用户界面描述语言UIML描述智能文档的操作界面。解析器解析UIML文档,获得界面控件信息及事件响应,并生成动态操作界面。基于模型,建立了一个原型系统,对系统进行了用例测试,测试结果验证了模型的可行性和正确性。
- 施运梅李宁刘旭红
- 关键词:智能文档用户界面
- DITA-OT中音乐元素域的扩展方法研究被引量:1
- 2013年
- 为扩展DITA-OT对音乐的支持能力,使之更好地适用于复合出版领域,提出了一种在DITA-OT中扩展音乐元素域的方法。通过元素域专门化,将MusicXML中的元素扩展到DITA-OT中,以便DITA-OT能够识别MusicXML中的元素,并建立专门的转换程序支持专门化过程。为验证方法的正确性,构建了一个包含MusicXML元素的DITA文档,运用上述方法对此文档实现了到XHTML和MIDI格式的正确转换。实验结果验证了DITA-OT中音乐元素域扩展方法的可行性和有效性。
- 刘鹏施运梅李宁刘旭红
- 关键词:复合出版
- 一种面向军事领域的事件论元抽取方法
- 本发明公开了一种面向军事领域的事件论元抽取方法,涉及事件论元抽取技术领域,包括如下具体步骤:步骤一、获取数据;步骤二、定义标注规则;步骤三、引入多标记实体分类器:将实体标注为单标记或多标记类型;步骤四、引入多标记实体导向...
- 王倩楠刘秀磊刘旭红郭冬冬
- 面向流式办公文档的查询语言
- 2015年
- 流式办公文档格式繁多,其配套的API依赖于开发平台,且不同版本之间差异较大,导致二次开发和信息查询困难,针对该问题,提出流式办公文档查询语言ODQ(office document query)。对不同流式办公文档格式和版本的API进行封装,为查询不同格式的文档提供一个简单、统一的查询接口。为屏蔽不同格式的差异,通过本体建立公共文档模型,涵盖流式办公文档常用的功能点,满足用户的常用需求。实验结果表明,ODQ使用简单且独立于平台,能够方便地嵌入到其它高级语言中,精简了代码量,降低了用户二次开发和信息查询的难度。
- 刘旭红施运梅侯霞李宁
- 关键词:查询语言信息检索互操作
- 基于路径分析和关系描述的知识图谱补全方法被引量:2
- 2021年
- 面对相对复杂的互联网信息,知识图谱能够将其表达成更加便于理解的形式,通过可视化技术加以显示并提供有价值的参考。但伴随数据实体及实体关系的快速扩增,知识图谱的稀疏性和连通性不足等问题日趋凸显。提出一种基于路径分析和关系描述的知识图谱补全方法,并以泛娱乐领域相关数据为例,对该方法的有效性进行验证。构建基于泛娱乐知识特点的泛娱乐领域知识图谱,并在该知识图谱上进行验证实验。实验结果表明,提出的方法能够很好地推理出知识图谱中的隐含与遗漏路径,有效地实现知识图谱补全,从而发现具有丰富价值的隐含知识。
- 佟强刘旭红陈雨婷陈玉立
- 关键词:情报获取知识表示
- 机器学习设计新型有机分子研究进展被引量:1
- 2021年
- 新型有机分子一直是有机化学领域的研究重点,其在开发高性能材料方面具有重要意义.传统的有机分子发现是一个类似于“炒菜”的试错过程,它耗时耗能且效率相对低下.常见的量子化学方法试图根据期望属性值筛选出合理的分子结构,以更好地指导实验,然而,由于计算资源相对于算法复杂度严重不足,精确给出实验指导在大多数情况下难以实现.近年来机器学习的出现改变了这种情况,训练好的模型可以快速推测出分子的属性.更令人兴奋的是机器学习可以逆向进行分子设计,拓宽人类的想象力,给出其在分子设计领域的“神之一手”.本综述首先介绍了逆向分子设计所必须的分子描述方式,随后对几种常见的深度生成模型加以归纳,对新型有机分子设计研究现状进行了总结,最后探讨了新型有机分子设计所面临的挑战,展示了笔者做出的部分探索.
- 谭胖刘旭红谌彤童秦智慧杨涛刘晓彤刘秀磊
- 关键词:BASE64编码
- 一种煤矿安全事故本体概念抽取方法
- 本发明提供了一种煤矿安全事故本体概念抽取方法,该方法将词向量和条件随机场结合起来对煤矿安全事故本体概念进行抽取,充分考虑领域词语的语义特性和领域特性,解决了传统研究方法在语义关系分析方面欠缺的问题以及煤矿安全领域数据管理...
- 刘秀磊 刘思含刘旭红 李红臣 崔展奇
- 文献传递