国家自然科学基金(61272260) 作品数:7 被引量:44 H指数:3 相关作者: 朱巧明 周国栋 徐霞 李培峰 褚晓敏 更多>> 相关机构: 苏州大学 江苏省计算机信息处理技术重点实验室 青岛理工大学 更多>> 发文基金: 国家自然科学基金 江苏省高校自然科学研究项目 江苏省自然科学基金 更多>> 相关领域: 自动化与计算机技术 交通运输工程 更多>>
半监督中文事件抽取中的模板过滤和转换方法 被引量:1 2015年 事件模板是指导事件抽取工作的依据,半监督方法下模板的准确性显得尤为重要。目前,基于双视图的"触发词-论元"模板的中文信息事件抽取系统不能有效地解决触发词一词多义的现象和模板稀疏现象。提出了一种借助论元进行触发词语义消歧的方法,并利用该方法进行模板过滤以消除无效模板的影响。另外,针对几种特殊的中文句型,根据句法结构提出了模板转换规则,从而提高了模板的适用性。在ACE2005中文语料上的测试表明,该方法可有效地提高半监督中文信息事件抽取系统的性能。 徐霞 李培峰 朱巧明关键词:事件抽取 中文文学作品中的社会网络抽取与分析 被引量:14 2017年 应用自然语言处理技术和复杂网络技术,可以对中文文学作品中内含的社会网络进行抽取和分析。该文以《三国演义》为例,抽取了其中的社会网络,节点是作品中的人物,边是人物之间的联系,边的权重为各章回中的人物共现次数。借助背景知识和互联网构建了角色库辅助网络建模。对构建出来的社会网络进行分析,包括节点度分布、中心性、聚类特征等。结果表明,中文文学作品中的角色分布具有明显的小世界性、有限幂律分布特征和社区特性,同时也有多面性和多元性。 赵京胜 张丽 朱巧明 周国栋关键词:文学作品 社会网络 自然语言处理 Research on Chinese negation and speculation: corpus annotation and identification 被引量:1 2016年 Bowei ZOU Guodong ZHOU Qiaoming ZHU关键词:汉语语料库 句法结构 一个半监督的中文事件抽取方法 被引量:4 2016年 半监督或无监督的事件抽取方法在目前依旧是一个具有挑战性的课题。针对中文本身在表述中存在的固有特点,该文提出一种基于双视图的事件抽取自举学习方法。该方法以少量种子为基础,从文档相关度与语义相似度两个视图出发,进行交互过滤筛选,不断抽取新的有效事件模板,为事件抽取服务。在ACE2005中文语料上的测试表明,和现有方法相比,该方法可以有效地提高中文信息事件抽取系统的性能。 徐霞 李培峰 朱巧明关键词:事件抽取 自举 语义相似度 自然语言处理中的篇章主次关系研究 被引量:23 2017年 篇章结构分析特别是篇章主次关系研究是自然语言处理领域的一个重要研究方向.篇章主次关系的分析,有助于理解篇章的结构和语义,并为自然语言处理的应用(例如自动文摘、主题抽取和问答系统等)提供有力的支持.然而,目前篇章主次关系分析却是篇章结构分析的一个瓶颈.已有研究一般将篇章主次关系分析看作篇章修辞结构分析中的一个辅助环节,忽略了其在篇章结构分析中的重要性.因此,文中将篇章主次关系提升到篇章结构分析的核心地位,将它从篇章修辞结构分析中分离出来作为一个独立的任务进行研究.首先,探讨了什么是篇章主次关系、如何判别篇章主次关系以及为什么要研究篇章主次关系;其次,分别从两个角度(微观、宏观)和三个方面(理论体系、语料资源和计算模型)详细阐述了篇章主次关系的研究现状;再次,分析了篇章主次关系研究存在的问题,并提出我们的基本研究思路;最后,归纳出篇章主次关系未来的一些研究方向. 褚晓敏 朱巧明 周国栋关键词:自然语言处理 篇章结构分析 社会媒体 平行推理机制:一种隐式篇章关系检测方法 被引量:2 2014年 篇章是论元经过语义关联和结构化组织形成的自然语言文体.篇章分析研究的核心任务之一是解释论元的语义关系,其中,显式关系因具有直观线索而易于检测,目前检测精度高达90%;相对而言,隐式关系因缺乏直观线索而难于检测,目前精度仅约40%.针对这一问题,基于一种"论元平行则关系平行"的假设,并利用显式篇章关系易于检测的特点,通过平行论元的识别与平行关系的消歧,实现了一种显式关系平行推理隐式关系的隐式篇章关系检测方法.利用标准宾州篇章关系树库(Penn discourse Tree Bank,简称PDTB)对这一检测方法进行评测,结果显示,精确率提升达17.26%. 洪宇 严为绒 车婷婷 梁颖红 姚建民 朱巧明 周国栋关键词:篇章 面向半监督中文事件抽取的事件推理方法 2014年 半监督中文事件抽取系统的性能依赖于种子模板,但自动获取的种子模板的表达方式与覆盖范围有限,导致某些语言现象下的事件实例很难被识别。为解决这一难题,基于篇章内的事件一致性理论提出基于同指事件与相关事件的推理方法,根据已抽取的事件实例来推理可能有同指关系与关联性的其它事件,从而进一步提高半监督中文事件抽取系统的性能。在ACE 2005中文语料上的测试表明,该方法可有效地提高半监督中文信息事件抽取系统的性能。 徐霞 李培峰 郑新 朱巧明关键词:事件抽取