搜索到3250篇“ 中文分词“的相关文章
一种基于动态规划的中文分词方法
本发明公开了一种基于动态规划的中文分词方法,涉及自然语言处理技术领域,步骤S1,获取至少一个中文文本信息,分析中文文本信息的基本属性;步骤S2,收集所有词语构建基本词库,将各个领域的常用名字划分,并将常用词语划分为高频词...
邓志滔闫旭东
中文分词方法、装置、设备及存储介质
本发明实施例提供一种中文分词方法、装置、设备及存储介质。方法包括:获取目标文本,并对所述目标文本分别进行句法分析以及语义依存分析,得到对应的句法分析结果以及语义依存分析结果;对所述目标文本、所述句法分析结果以及所述语义依...
于凤英王健宗程宁
中文分词的方法、装置及电子设备
本申请提供了一种中文分词的方法、装置、电子设备及存储介质,所述方法包括:通过获取待分词文本及领域词典,利用领域词典对待分词文本构建词图;利用预设分词模型对待分词文本进行分词处理,并依据得到的第一分词结果对词图进行修正;依...
叶松林王天祥刘楚雄胡昌菊
基于频繁项的中文分词边界修正方法
本发明涉及基于频繁项的中文分词边界修正方法。传统的基于词典的中文分词方法严格依赖于词典的质量,无法对未登录词进行识别。本发明从规范标准中抽取术语作为词典;将待处理的地铁设计规范文本作为输入文本S1,进行逆向最大匹配处理,...
任晓春王玮谢斯张雨朱磊
中文分词方法、电子装置及可读存储介质
本发明涉及数据分析技术领域,具体提供一种基于卷积神经网络模型的中文分词方法、电子装置及可读存储介质,该卷积神经网络模型的第四层卷积层构建有注意力机制,注意力机制用于调整各通道权重。本发明提供的中文分词方法,首先获取字向量...
金戈徐亮
中文分词的方法、装置及计算机设备
本申请公开了一种中文分词的方法、装置及计算机设备,涉及计算技术领域,可以解决在进行中文分词时,对基于分词离散序列预测的中文分词效果不佳,且分词成本较高的问题。其中方法包括:训练搭建符合预设标准的分词序列生成模型;利用所述...
陈梦霏
一种特种设备维护问答系统的中文分词方法
本发明公开了一种特种设备维护问答系统的中文分词方法,属于数据处理技术领域,包括:S1、构建特种设备维护问答系统中中文分词的训练数据集;S2、对训练数据集中的文本预处理,并定义其分词标签;S3、利用定义分词标签的训练数据集...
张展彬
基于多任务学习的多标准中文分词方法
本发明公开一种基于多任务学习的多标准中文分词方法,涉及自然语言处理技术领域。本发明充分利用不同标准的分词语料,将多个数据集共同训练充分学习其共享信息以提高OOV召回率;输入多个具有不同分词标准的数据集;利用BERT预训练...
黄于欣罗高生刘朋
一种中文分词方法、装置、电子设备及存储介质
本发明提供了一种中文分词方法、装置、电子设备及存储介质,包括步骤:获取待处理文本序列,待处理文本序列中包括多个依次排列的字符;提取待处理文本序列中每个字符对应的特征向量,得到一个特征向量组;将特征向量组中每个特征向量映射...
李寿山张栋周国栋
一种特种设备维护问答系统的中文分词方法
本发明公开了一种特种设备维护问答系统的中文分词方法,属于数据处理技术领域,包括:S1、构建特种设备维护问答系统中中文分词的训练数据集;S2、对训练数据集中的文本预处理,并定义其分词标签;S3、利用定义分词标签的训练数据集...
张展彬

相关作者

张旻
作品数:230被引量:224H指数:6
供职机构:杭州电子科技大学
研究主题:自适应能力 文本 向量 图像 卷积
姜明
作品数:251被引量:448H指数:9
供职机构:杭州电子科技大学
研究主题:自适应能力 文本 图像 向量 卷积
龙华
作品数:571被引量:477H指数:9
供职机构:昆明理工大学信息工程与自动化学院
研究主题:语种识别 包装盒 相似度 语音 文本
车万翔
作品数:89被引量:899H指数:13
供职机构:哈尔滨工业大学
研究主题:语义角色标注 中文信息处理 中文 中文分词 依存句法分析
刘挺
作品数:376被引量:3,783H指数:32
供职机构:哈尔滨工业大学
研究主题:自然语言处理 中文 中文信息处理 计算机应用 语言模型