林燕芬
- 作品数:3 被引量:1H指数:1
- 供职机构:哈尔滨商业大学计算机与信息工程学院更多>>
- 发文基金:黑龙江省教育厅科学技术研究项目黑龙江省自然科学基金更多>>
- 相关领域:理学语言文字自动化与计算机技术更多>>
- 汉语选择复句的计算机自动改写方法研究
- 2016年
- 在对汉语复句分类的基础上,提出了基于模板的选择复句的改写方法。通过对选择复句进行分类及语法结构的形式化、数学描述,从而抽取了选择复句的改写模板。由预备实验确定了改写语句与改写模板之间的相似度阈值。最后利用小规模的语料进行了选择语句的自动改写实验,实验结果的正确率61.0%和模板覆盖率45.5%均表明了方法的有效性。
- 林燕芬杨柳
- 关键词:选择复句形式化表示自动文摘词法分析长句
- 基于模板的汉语复句改写方法研究
- 2016年
- 在汉语简单句改写的基础上,提出了基于模板的汉语复句的改写方法.通过对复句分类以及复句的语法结构分析,进而抽取复句的改写模板.在构筑以关联词为核心的复句语料库,对语料库进行分词、词性标注等处理的基础上,通过大量的相似度计算实验,确定了待改写句与其改写模板之间的阈值,进行的改写实验结果表明复句模板覆盖率为40.20%,改写正确率62.61%.
- 林燕芬郜炎峰王忠建
- 关键词:复句关联词语料库
- 基于马尔科夫模型的汉语语句相似度计算被引量:1
- 2017年
- 语句相似度计算在自然语言处理领域是一项非常重要的实用技术,基于马尔科夫模型的汉语语句相似度计算方法通过对语句进行分词处理、构建特征词向量以及权重值向量的方式实现了语句相似度计算.该方法以关系向量模型为基础,通过深入研究汉语语句的特征,利用前后相邻词的共现对权重值向量进行加权处理,以调整不同特征词的权重.方法重点考虑了关键词词形的相似度,结合了句长、词序等表面信息的相似度,并考虑了同义词的情况.最后采用两种不同的方案与关系向量模型进行了对比实验,结果表明方法可以更好的处理长度差很大的两个语句的相似度计算问题,尤其在检索相关新闻标题时准确率较高.
- 郜炎峰林燕芬王忠建
- 关键词:马尔科夫语句相似度词形