搜索到993篇“ 中文命名实体识别“的相关文章
- 基于BERT的多特征融合中文命名实体识别
- 2025年
- 针对中文命名实体识别往往需要引入外部知识获取深层语义信息,以及基于RNN结构的模型对空间特征提取效果不佳等问题,提出了基于BERT的多特征融合中文命名实体识别模型.通过BERT模型获取输入文本序列的深层次语义信息,利用MHSA模块和IDCNN模块增强特征提取能力.前者利用相对位置编码和多头自注意力机制来捕获输入序列的隐藏特征,使模型能够考虑到字符间的距离方向信息;后者则可以对空间特征建模,获得输入序列的全局信息.通过将两个模块的输出特征进行连接,增强模型性能.实验结果表明:模型在MSRA、Resume和Weibo三个公共数据集上的F1值分别达到了95.12%、95.45%和66.14%,优于其它最新模型,验证了模型在中文命名实体识别上的有效性.
- 孙璐冰康怡琳王俊王俊
- 关键词:自然语言处理中文命名实体识别
- 基于LEBERT的时间信息增强中文命名实体识别
- 2025年
- 为解决现有预训练模型没有充分考虑汉语词汇的分割特征的问题,提出一种基于LEBERT-ILRN-RA-CRF的中文命名实体识别模型。该模型首先利用LEBERT对输入文本进行词汇表增强和嵌入处理,然后利用ILRN模块提取时间信息,并将字符-词融合与字向量采集相结合,最后使用条件随机场(CRF)进行结果校正。此外,该模型还引入了词汇量增强和残差门控注意网络来加强时间特征的提取和局部特征的表达,进一步提升了模型的识别效果。在Weibo和Resume两个数据集上分别取得了71.73%和96.51%的宏F1值。实验表明该模型可以考虑到汉语词汇的分割问题,改善中文命名实体识别任务的识别效果。
- 张光明肖然张弛高谦谈栋华彭菊红
- 关键词:中文命名实体识别CRF
- 基于多特征融合和注意力机制的中文命名实体识别
- 2025年
- 近年来,基于字符级嵌入的BERT模型和基于词融合的模型都在中文命名实体识别领域取得了较好的效果,但目前这些模型从字符序列中提取出的特征信息还不够充分,模型性能还有一定的提升空间.因此本文提出了一种用于中文命名实体识别的多特征融合模型,首先将输入中文语句转换为字词对序列,通过RoBERTa-wwm预训练语言模型将字词对序列中的字符序列表征为字符向量,获得全局语义特征;然后把词序列转化为词向量,再将字符向量和词向量输入到基于双线性注意力机制的词汇适配器获得字词融合特征;同时将字符向量送入到双向长短时记忆网络(BiLSTM)获得包含字符方向信息的上下文特征;最后将词汇适配器的输出和BiLSTM的输出进行动态特征融合获得包含全局语义信息、词汇信息和方向信息的上下文特征,再通过CRF解码获得最优预测序列.在多个公共数据集的实验结果验证了该模型能提取到更充分的特征信息,提高了识别性能.
- 陈奕全吴晓鸰占文韬HEO Hoon
- 关键词:中文命名实体识别多特征融合
- 融合位置和实体类别信息的中文命名实体识别
- 2025年
- 词语作为一种上下文信息在中文命名实体识别(NER)任务中发挥着重要作用。以往基于字符的中文NER方法虽然在一定程度上取得了成功,但仍存在词语信息嵌入方式简单、特征捕捉方式单一,且忽视了潜在词的影响、未能充分利用词语信息的问题。针对上述问题,提出一种改进的中文NER方法。首先,通过基于全遮蔽技术的预训练模型RoBERTa-wwm将文本表示为字符级嵌入向量;其次,使用门控空洞卷积神经网络(DGCNN)模型进一步捕捉文本的特征信息;然后,在键值记忆网络(KV-MemNN)模型中采用位置实体类别组合机制(PECM)更有效地融合词语信息并缓解潜在词冲突所带来的影响;最后,利用条件随机场(CRF)模型对预测结果进行约束得到最佳标签序列。实验结果表明,该方法在Weibo、MSRA和Resume数据集上的F1值分别达到71.82%、95.00%和96.14%,相比于融合词语信息的FLAT模型分别提升了11.50、0.88、0.69百分点,同时在不同实体上的识别表现整体优于RoBERTa-wwm+CRF和Lattice LSTM模型。此外,通过预训练模型的对比和消融实验进一步证明了KV-MemNN和RoBERTa-wwm模型的有效性。
- 杨竣辉李苏晋
- 关键词:命名实体识别
- 融合多阶段特征的中文命名实体识别模型
- 2025年
- 针对中文命名实体识别中未充分利用完整的文本表示和语句特征的问题,提出一种融合多阶段特征的中文命名实体识别模型(LM-CNER)。采用全局注意力机制文本融合字符级嵌入与其预训练词向量,同时获取字符级特征和单词级特征。采用翻转长短时记忆网络(Re-LSTM)进行上下文特征提取,采用多头自注意力机制进行句法分析,并将二者进行拼接。使用条件随机场作为解码器,得到命名实体识别结果。在微博和简历两个数据集上的实验结果表明,该模型能够获取更加准确的文本表示和语句特征,提升模型的实体识别效果。
- 杨先凤范玥李自强汤依磊
- 关键词:命名实体识别编码器条件随机场
- 基于FLAT的中文命名实体识别方法、存储介质、设备
- 本发明公开基于FLAT的中文命名实体识别方法、存储介质、设备,涉及中文命名实体识别技术领域,方法包括:基于FLAT模型,在模型的Transformer编码器中的全局注意力机制的基础上,引入局部窗口注意力机制,构建全局‑局...
- 马明杰李振华王倩倩李浩
- 一种结合词汇增强和对抗学习的中文命名实体识别方法、系统和介质
- 本发明提出了一种结合词汇增强和对抗学习的中文命名实体识别方法、系统和介质,该识别方法包括以下步骤:S1,接收文本数据,进行预处理;S2,使用预训练语言模型将文本中的字符转换为向量表示,捕捉语义和语法信息;S3,在字符嵌入...
- 冯禄华陆艳军刘万平陈运启刘浩楠
- 一种基于层次标签增强对比学习的中文命名实体识别方法
- 本发明公开了一种基于层次标签增强对比学习的中文命名实体识别方法,包括:1、使用预训练语言模型对标签和字符分别进行编码;2、通过跨模态Transformer网络将编码结果进行深度融合,生成增强特征;3、通过句子级对比学习法...
- 赵山黄鹏宇王承禹徐旺张妮妮
- 中文命名实体识别研究综述被引量:18
- 2024年
- 命名实体识别(named entity recognition,NER)是自然语言处理中最基本的任务之一,其主要内容是识别自然语言文本中具有特定意义的实体类型和边界。然而,中文命名实体识别(Chinese named entity recognition,CNER)的数据样本存在词边界模糊、语义多样化、形态特征模糊以及中文语料库内容较少等问题,导致中文命名实体识别性能难以大幅提升。介绍了CNER的数据集、标注方案和评价指标。按照CNER的研究进程,将CNER方法分为基于规则的方法、基于统计的方法和基于深度学习的方法三类,并对近五年来基于深度学习的CNER主要模型进行总结。探讨CNER的研究趋势,为新方法的提出和未来研究方向提供一定参考。
- 赵继贵钱育蓉王魁侯树祥陈嘉颖
- 关键词:自然语言处理中文命名实体识别
- 基于特征融合的中文命名实体识别研究
- 随着互联网技术的飞速发展,大量文本数据在网络中不断涌现,这不仅促进了信息传播的速度与广度,同时也对信息处理技术提出了更高的要求。在自然语言处理领域,命名实体识别作为一项关键技术得到了迅速发展和完善。命名实体识别是一种计算...
- 丁海博
- 关键词:中文命名实体识别
相关作者
- 冯元勇

- 作品数:14被引量:152H指数:6
- 供职机构:中国科学院软件研究所
- 研究主题:中文信息处理 自然语言处理 计算机应用 中文命名实体识别 条件随机场
- 张大鲲

- 作品数:12被引量:171H指数:4
- 供职机构:中国科学院软件研究所
- 研究主题:自然语言处理 中文命名实体识别 条件随机场 机器翻译 统计机器翻译
- 施水才

- 作品数:118被引量:626H指数:10
- 供职机构:北京信息科技大学计算机学院
- 研究主题:条件随机场 信息抽取 RSS 信息检索 文本聚类
- 吕学强

- 作品数:407被引量:1,406H指数:17
- 供职机构:北京信息科技大学
- 研究主题:抽取方法 图像 搜索日志 中文 条件随机场
- 俞鸿魁

- 作品数:10被引量:489H指数:5
- 供职机构:北京信息科技大学中文信息处理研究中心
- 研究主题:ICTCLAS 角色标注 命名实体识别 中文命名实体识别 隐马尔可夫模型