您的位置: 专家智库 > >

刘艳超

作品数:13 被引量:11H指数:2
供职机构:昆明理工大学更多>>
发文基金:国家自然科学基金云南省自然科学基金更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 7篇专利
  • 4篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 5篇自动化与计算...
  • 4篇语言文字

主题

  • 13篇越南语
  • 7篇最大熵
  • 6篇歧义
  • 6篇词法分析
  • 5篇消歧
  • 5篇句法分析
  • 4篇歧义消解
  • 4篇句法
  • 4篇兼类词
  • 3篇语言处理
  • 3篇随机场
  • 3篇条件随机场
  • 3篇自然语言
  • 3篇自然语言处理
  • 3篇自然语言处理...
  • 3篇处理技术
  • 3篇词性
  • 2篇信息抽取
  • 2篇随机场模型
  • 2篇条件随机场模...

机构

  • 13篇昆明理工大学

作者

  • 13篇刘艳超
  • 12篇余正涛
  • 12篇郭剑毅
  • 6篇线岩团
  • 4篇毛存礼
  • 4篇周兰江
  • 3篇严馨
  • 2篇陈玮
  • 2篇熊明明
  • 2篇陈秀琴
  • 2篇文永华
  • 1篇王红斌
  • 1篇周枫
  • 1篇李佳

传媒

  • 1篇数据采集与处...
  • 1篇中文信息学报
  • 1篇计算机科学
  • 1篇智能系统学报

年份

  • 1篇2020
  • 2篇2019
  • 1篇2018
  • 2篇2017
  • 6篇2016
  • 1篇2015
13 条 记 录,以下是 1-10
排序方式:
融合语言特性的越南语兼类词消歧被引量:2
2019年
兼类词歧义直接影响词性标注的准确率。本文针对越南语兼类词歧义问题提出一种融合语言特性的越南语兼类词消歧方法。通过构建越南语兼类词词典和兼类词语料库,分析越南语的语言特征和兼类词特点,选取有效的特征集;然后利用条件随机场能添加任意特征等优点,在使用词和词性上下文信息的同时,引入句法成分和指示词特征,得到消歧模型。最后在兼类词语料上实验,准确率达到了87.23%。实验表明本文所提出的越南语兼类词消歧方法有效可行,可以提高词性标注正确率。
郭剑毅赵晨刘艳超毛存礼余正涛
关键词:语言特征条件随机场模型越南语
基于组合方法的越南语兼类词消歧方法
本发明涉及基于组合方法的越南语兼类词消歧方法,属于自然语言处理技术领域。本发明首先从越南语文本中抽取越南语兼类词字段,构建兼类词字段库,其次对兼类词字段库分别进行最大熵、条件随机场、支持向量机词性歧义消解建模,再把待消歧...
余正涛刘艳超郭剑毅线岩团严馨文永华
文献传递
一种基于支持向量机的越南语词性标注方法
本发明涉及一种基于支持向量机的越南语词性标注方法,属于自然语言处理技术领域。本发明包括步骤:首先对形成的越南语句子级的词性标注语料进行越南语词的词性标注建模,得到越南语支持向量机词性标注模型;从越南语分词句子级语料库中随...
郭剑毅刘艳超余正涛线岩团毛存礼王红斌
文献传递
越南语浅层句法分析方法的研究
随着两国政治、经济和文化等方面日益频繁接触和深入合作,语言交流显得尤为重要。由于两国语言相差较大,造成了沟通上的障碍,进而成为两国发展的绊脚石;同时越南语自然语言处理在人工智能中起到核心作用,同样底层的浅层句法分析是自然...
刘艳超
关键词:越南语兼类词最大熵条件随机场
文献传递
一种基于条件随机场和转换学习越南语组块方法
本发明涉及一种基于条件随机场和转换学习越南语组块方法,属于自然语言处理技术领域。本发明包括步骤:首先对越南语语料进行预处理,得到句子级的越南语组块训练语料;从数据库中提取出句子级的越南语组块训练语料并对其进行组块建模,得...
余正涛刘艳超郭剑毅
文献传递
基于组合方法的越南语兼类词消歧方法
本发明涉及基于组合方法的越南语兼类词消歧方法,属于自然语言处理技术领域。本发明首先从越南语文本中抽取越南语兼类词字段,构建兼类词字段库,其次对兼类词字段库分别进行最大熵、条件随机场、支持向量机词性歧义消解建模,再把待消歧...
郭剑毅刘艳超余正涛线岩团严馨文永华
基于最大熵模型的越南语交叉歧义消解
越南语中存在大量的交叉歧义.为了解决交叉歧义给分词、词性标注、实体识别和机器翻译等带来的影响,本文选取统计特征、上下文特征和歧义字段内部特征,尝试性地构建最大熵模型,对越南语的交叉歧义进行消解.本文通过三种方法整理出包含...
熊明明刘艳超郭剑毅余正涛周兰江陈秀琴
一种基于最大熵的越南语交叉歧义消岐方法
本发明涉及一种基于最大熵的越南语交叉歧义消岐方法,属于自然语言处理技术领域。本发明首先对形成的越南语交叉歧义字段库中的越南语交叉歧义字段语料进行消歧建模,得到越南语最大熵交叉歧义消歧模型;从越南语交叉歧义字段语料中随机选...
余正涛刘艳超郭剑毅毛存礼线岩团陈玮
文献传递
基于多分类器加权投票法的越南语组合歧义消歧被引量:4
2018年
组合歧义消解是分词中的关键问题之一,直接影响到分词的准确率。为了解决越南语组合歧义对分词的影响问题,结合越南语组合型词的特点,提出了一种基于集成学习的越南语组合歧义消解方法。该方法首先通过人工选取越南语组合歧义词,构建出越南语组合歧义字段库,对越南语语料与越南语组合词词典进行匹配,抽取出越南语组合歧义字段;其次,采用三类分类器引入越南语词频特征和上下文信息,构建三类分类器消解模型,得到三类分类器消解结果;最后,计算出各分类器权值,通过阈值对越南语组合歧义进行最终分类。实验表明,所提方法的正确率达到了83.32%,与消歧结果最好的单个分类器相比准确率提高了5.81%。
李佳郭剑毅刘艳超余正涛线岩团阮氏青娥
关键词:越南语
融合实体特性识别越南语复杂命名实体的混合方法被引量:2
2016年
命名实体识别是自然语言处理过程中的基础任务。本文针对越南语的复杂命名实体难识别及F值不够高的问题,提出了一种结合实体库的越南语命名实体识别混合方法。首先,本文根据越南语的语言和实体特点,选取有效的局部特征和全局特征,应用最大熵模型进行越南语命名实体识别;其次,根据本文制定的命名实体的规则进行越南语命名实体识别;然后,结合两者的识别结果,以规则为主,统计为辅原则;最后经过人工校对,把获取到的正确标记的实体加入到实体库,动态扩增实体库,为规则制定和特征选取提供丰富的语料和依据。实验表明,该方法能够有效地结合规则与统计的方法优点,互相弥补不足,明显提高了识别的正确率、召回率和F值。
刘艳超郭剑毅余正涛周兰江严馨陈秀琴
关键词:越南语最大熵
共2页<12>
聚类工具0