您的位置: 专家智库 > >

陈家骏

作品数:195 被引量:764H指数:14
供职机构:南京大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划江苏省自然科学基金更多>>
相关领域:自动化与计算机技术文化科学语言文字建筑科学更多>>

文献类型

  • 101篇期刊文章
  • 78篇专利
  • 14篇会议论文
  • 1篇学位论文
  • 1篇科技成果

领域

  • 121篇自动化与计算...
  • 25篇文化科学
  • 13篇语言文字
  • 2篇建筑科学
  • 2篇一般工业技术
  • 2篇理学
  • 1篇经济管理
  • 1篇机械工程
  • 1篇电子电信
  • 1篇电气工程
  • 1篇环境科学与工...

主题

  • 53篇翻译
  • 49篇机器翻译
  • 20篇计算机
  • 17篇语料
  • 17篇自然语言
  • 16篇中文
  • 15篇汉语
  • 13篇语言
  • 13篇分词
  • 12篇句法
  • 11篇源语
  • 11篇源语言
  • 11篇相似度
  • 11篇向量
  • 11篇抽取
  • 10篇语言处理
  • 10篇自然语言处理
  • 10篇文本
  • 10篇句子
  • 9篇对齐

机构

  • 178篇南京大学
  • 17篇河海大学
  • 12篇安徽工业大学
  • 11篇南京师范大学
  • 3篇滁州学院
  • 1篇江苏警官学院
  • 1篇南京航空航天...
  • 1篇江苏工业学院
  • 1篇南京理工大学
  • 1篇江苏教育学院
  • 1篇国电南京自动...
  • 1篇鹏城实验室
  • 1篇安徽工程大学...

作者

  • 195篇陈家骏
  • 121篇戴新宇
  • 88篇黄书剑
  • 69篇张建兵
  • 31篇尹存燕
  • 22篇何亮
  • 15篇王启祥
  • 13篇周俊生
  • 12篇杨思春
  • 10篇郑国梁
  • 10篇奚宁
  • 9篇赵迎功
  • 6篇贾修一
  • 5篇高超
  • 5篇商琳
  • 5篇袁晓东
  • 4篇李博渊
  • 3篇程节华
  • 3篇曲维光
  • 3篇张亮

传媒

  • 17篇中文信息学报
  • 8篇计算机应用研...
  • 7篇计算机工程与...
  • 6篇电子学报
  • 6篇计算机科学
  • 5篇计算机研究与...
  • 5篇编辑学报
  • 4篇广西师范大学...
  • 4篇中国科技期刊...
  • 3篇软件学报
  • 3篇河海大学常州...
  • 3篇计算机教育
  • 2篇南京大学学报...
  • 2篇科技与出版
  • 2篇情报学报
  • 2篇计算机工程与...
  • 2篇计算机科学与...
  • 1篇学术交流
  • 1篇力学与实践
  • 1篇图书情报工作

年份

  • 17篇2023
  • 17篇2022
  • 3篇2021
  • 12篇2020
  • 3篇2019
  • 9篇2018
  • 8篇2017
  • 6篇2016
  • 6篇2015
  • 4篇2014
  • 3篇2013
  • 7篇2012
  • 10篇2011
  • 1篇2010
  • 10篇2009
  • 12篇2008
  • 10篇2007
  • 7篇2006
  • 8篇2005
  • 6篇2004
195 条 记 录,以下是 1-10
排序方式:
一种自动探索更多参考译文信息的机器翻译优化方法
本发明公开了一种自动探索更多参考译文信息的机器翻译优化方法,利用图扩展参考译文的信息,对机器翻译得到的译文进行更充分的评价,同时在利用译文信息扩展的评价方法参与训练过程时,帮助系统更好的进行参数学习。主要步骤如下:利用G...
黄书剑季红洁戴新宇陈家骏张建兵
日汉机器翻译系统中的词典讨论被引量:4
1998年
本文讨论了日汉机器翻译系统中有关词典的同音词、同型词、兼类词、挑选汉译词以及惯用型处理等几个问题,这些问题的解决将直接影响日汉机器翻译系统的译文质量。
雍殿书胡海文陈家骏王启祥
关键词:机器翻译词典同音词多义词
一种基于深度对齐矩阵分解模型进行学术论文推荐的方法
本发明公开了一种基于深度对齐矩阵分解模型进行学术论文推荐的方法,包括:分别通过两个非线性多层感知器,将用户和论文以及论文和单词映射到相同维度的低维特征空间;通过最大化同一篇论文的两种低维表示向量之间的相似度,在两个非线性...
戴新宇戴瑾黄书剑张建兵尹存燕陈家骏
文献传递
利用基于词上下文的字嵌入与神经网络的中文分词方法
本发明提出了一种利用基于词上下文的字嵌入与神经网络的中文分词方法,在大规模的自动切分数据上学习字嵌入,将学习得到的字嵌入作为神经网络分词模型的输入,可以有效帮助模型学习。具体步骤如下:根据字上下文以及词位标记在大规模自动...
戴新宇郁振庭陈家骏黄书剑张建兵
文献传递
利用外部信息的神经机器翻译方法
本公开涉及利用外部信息的神经机器翻译方法,包括:接收源端源语言的文字序列作为源端输入;接收目标语言的文字序列作为外部信息输入;根据源端输入和外部信息输入,生成源端源语言文字序列的译文作为目标端输出。本公开提供的神经机器翻...
黄书剑郑在翔戴新宇张建兵尹存燕陈家骏
文献传递
一种基于层间自注意力的中文拼写纠错方法
本发明提出了一种基于层间自注意力的中文拼写纠错方法,其利用n元语法令牌作为查询,对BERT的不同层上的字符表示进行自注意力查询并加权融合,并利用字符的最终表示进行拼写纠错任务。通过引入BERT编码器中不同层次的抽象知识,...
戴新宇曹永昌何亮吴震张建兵黄书剑陈家骏
自然语言信息抽取中的机器学习方法研究被引量:21
2005年
信息抽取是一种用于处理各种类型文本文档的非常有效的方法,然而建立一个文本信息抽取系统却是非常困难和耗费时间的。近年来,基于统计的机器学习方法在信息抽取领域的研究受到了广泛关注。本文深入探讨了当前自然语言信息抽取领域广泛采用的几种非常有效的统计学习方法,比较分析了各种方法的统计推断过程和学习算法及其优缺点,讨论了各种统计学习方法所面临的训练语料匮乏问题的主要解决方法,并指出了今后进一步研究的方向。
周俊生戴新宇尹存燕陈家骏
关键词:自然语言信息抽取机器学习方法统计学习
面向微博的中文反语识别研究被引量:3
2015年
反语识别已成为当前研究的热点,但当前对于中文反语识别研究报道较少。针对于此,主要研究面向社交网络的中文反语识别。在借鉴外文相关工作的基础上,结合中文语言和社交网络的特性,构建了六种特征,通过信息增益对比了各种特征有效性,并检测了不同分类器在该特征体系中的稳定性。实验结果表明,本文构建的特征在识别反语的任务中有显著的效果。
邓钊贾修一陈家骏
基于层叠条件随机场模型的中文机构名自动识别被引量:135
2006年
中文机构名的自动识别是自然语言处理中的一个比较困难的问题.本文提出了一种新的基于层叠条件随机场模型的中文机构名自动识别算法.该算法在低层条件随机场模型中解决对人名、地名等简单命名实体的识别,将识别结果传递到高层模型,为高层的机构名条件随机场模型实现对复杂机构名的识别提供决策支持.文中为机构名条件随机场模型设计了有效的特征模板和特征自动选择算法.对大规模真实语料的开放测试中,召回率达到90.05%,准确率达到88.12%,性能优于其它中文机构名识别算法.
周俊生戴新宇尹存燕陈家骏
关键词:中文机构名识别条件随机场
英汉TBMT中模板抽取的改进算法及应用被引量:3
2002年
基于模板的机器翻译(简称TBMT)是为了提高当前机器翻译系统译文生成质量而采用的一种新的翻译方法,该技术的关键是模板的抽取。文章针对英汉机器翻译中的现存问题,在“动词+虚词”形式的模板抽取算法的基础上提出一种改进算法,应用该算法可较好地解决英汉机器翻译中的一些歧义问题。
杨思春程节华陈家骏王启祥
关键词:英汉机器翻译计算机
共20页<12345678910>
聚类工具0