徐艺峰
- 作品数:2 被引量:3H指数:1
- 供职机构:北京大学更多>>
- 发文基金:国家自然科学基金北京市重点实验室开放基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 汉语篇章级小句关系的标注体系被引量:3
- 2015年
- 句际关系自动分析属于篇章语义学研究的范畴,虽然英语句际关系的研究已有大量工作,但汉语句际关系的自动分析还只是刚刚起步。该文在RST理论框架下,结合汉语特点,提出了完整的汉语篇章级小句关系标注体系。将汉语话题和逻辑关系置于同一个框架下进行描述,将小句关系划分为事件附属关系和事件逻辑关系两大类。逻辑关系又包括6个中类、15个小类。目前已在人民日报语料上完成了8 000个句子的小句关系标注。抽取出其中1 000个句子检测了双盲标注的一致性,揭示了汉语意合性语言小句关系标注的困难;并基于标注数据对关系类型进行了定量分析,指示了汉语句际关系自动分析将面临的重点和难点。
- 吴云芳徐艺峰王恺然
- 关键词:句际关系小句关系语料库标注
- 基于排序方法的汉语句际关系树自动分析(英文)
- 2016年
- 提出一种自动分析汉语小句级句际关系树的新方法。在修辞结构理论体系下,构建一个汉语句际关系标注语料库。不同于传统的只关心相邻两个单元的方法,提出一种类排序模型(SVM-R),自动构建汉语句际关系的树结构,旨在把握相邻3个单元之间的关联强度。实验结果表明,所提出的SVM-R模型对句际关系树的分析显著优于传统方法。最后提出并验证了丰富的、适合于汉语句际关系分析的语言特征。
- 吴云芳万富强徐艺峰吕学强