搜索到1647篇“ 词语相似度“的相关文章
一种基于词语相似的中文短文本分类方法和系统
本发明公开了一种基于词语相似的中文短文本分类方法和系统,可应用于判断文本事件类型及对文本进行分类。包括以下步骤:利用预设的事件类型集对文本进行分词,获得事件触发词和所属事件类型标签的向量形式。对得到的分词文本进行文本特...
邢玛丽翟子朗詹汉城鲁仁全常乐
一种结合知网与词林的词语相似获取方法及系统
本发明公开了一种结合知网与词林的词语相似获取方法及系统,利用《知网》义原层次树计算知网义原信息内容含量;并构建第一词语相似计算模型;根据扩展版《同义词词林》词林拓扑树中的路径信息构建第二词语相似计算模型;根据待测词...
唐贤伦罗杨党晓圆杨敬明邓武权邹密徐梓辉李锐
一种基于Word2Vec模型的WordNet中词语相似计算方法
本发明公开了一种基于Word2Vec模型的WordNet中词语相似计算方法,该相似计算方法先从WordNet名词数据集data.noun中提取标号集,然后使用Word2Vec模型训练提取的标号集,然后使用Word2V...
王艳娜周子力张景虎陈丹华王凯莉李天宇赵晓函
词语相似获取方法、装置、设备及计算机存储介质
本申请公开了一种词语相似获取方法、装置、设备及计算机存储介质,涉及大数据技术领域。该方法包括:对文本语料数据进行处理,得到至少一个词语,以及所述至少一个词语分别对应的词频;将所述至少一个词语以及所述至少一个词语分别对应...
杨猛
词语相似的计算方法、装置、计算机设备及存储介质
本发明实施例公开了一种词语相似的计算方法、装置、计算机设备及存储介质,包括:获取训练文本的训练义原集合;获取所述第一词语的第一义原集和所述第二词语的第二义原集;根据所述训练义原集合、所述第一义原集和所述第二义原集,确定...
黄妍仪覃剑鸿莫可京孙炜姜佰胜熊浩敏陈磊
一种词语相似计算方法、装置以及存储介质
本发明公开了一种词语相似计算方法,所述方法包括:获取第一词语和第二词语的交并比、所述第一词语的长、所述第二词语的文字在所述第一词语的聚合、所述第二词语的文字在所述第一词语的前置匹配;利用预设词语相似算法计算所述...
曾万贵黄俊钧
文献传递
词语相似确定方法、装置、存储介质及计算机设备
本申请公开了一种词语相似确定方法、装置、存储介质及计算机设备,该方法应用于计算机设备中,包括:基于同义词词林确定第一词语所对应的第一义项集合和第二词语所对应的第二义项集合,并确定第一义项集合中处于叶子结点的第一义项在叶...
不公告发明人
文献传递
一种确定词语相似的方法及系统
本发明实施例公开了一种确定词语相似的方法及系统,考虑了两个短句含有相似词组但顺序不同的情况,是对于特定业务场景来说使用相对较低的计算资源和相对较高精词语相似计算方法,本方法利用了词组在说明文字的短句中,位置的改变...
孙其凡
文献传递
一种结合知网与词林的词语相似获取方法及系统
本发明公开了一种结合知网与词林的词语相似获取方法及系统,利用《知网》义原层次树计算知网义原信息内容含量;并构建第一词语相似计算模型;根据扩展版《同义词词林》词林拓扑树中的路径信息构建第二词语相似计算模型;根据待测词...
唐贤伦罗杨党晓圆杨敬明邓武权邹密徐梓辉李锐
文献传递
基于Word2Vec的WordNet词语相似计算研究被引量:5
2022年
当前大部分WordNet词语相似计算方法由于未充分考虑词语的语义信息和位置关系,导致相似的准确率降低。为解决上述问题,提出了一种使用词向量模型Word2Vec计算WordNet词语相似的新方法。在构建WordNet数据集时提出一种新形式,不再使用传统的文本语料库,同时提出信息位置排列方法对数据集加以处理。利用Word2Vec模型训练WordNet数据集后得到向量表示。在公开的R&G-65、M&C-30和MED38词语相似测评集上完成了词语相似计算任务,从多个角进行了Pearson相关系数对比实验。结果显示该文计算的相似值与人工判定值计算取得的Pearson相关系数指标得到了显著提升。
陈丹华王艳娜周子力赵晓函李天宇王凯莉
关键词:词语相似度WORDNET

相关作者

朱新华
作品数:91被引量:242H指数:8
供职机构:广西师范大学
研究主题:领域本体 自然语言识别 句子 神经网络 词语相似度
白宇
作品数:20被引量:44H指数:3
供职机构:沈阳航空工业学院
研究主题:词语相似度 计算方法 抽取技术 信息检索 问答系统
王小林
作品数:77被引量:272H指数:10
供职机构:安徽工业大学
研究主题:知网 词语相似度 数字水印 人脸特征点定位 存储器
蔡东风
作品数:183被引量:574H指数:10
供职机构:沈阳航空航天大学
研究主题:机器翻译 知网 条件随机场 问答系统 译文
张培颖
作品数:87被引量:169H指数:7
供职机构:中国石油大学(华东)
研究主题:虚拟网络 映射方法 网络 网络资源 句子相似度