贡正仙
- 作品数:47 被引量:118H指数:7
- 供职机构:苏州大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金江苏省高技术研究计划项目江苏省教育厅自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学语言文字更多>>
- 一种分类器训练方法、分类器和情感分类系统
- 本申请提供一种分类器训练方法、分类器和情感分类系统,上述方法包括:获取主题集合中至少一个主题的已标注的评论文本,作为训练样本;获取主题集合中至少一个主题的未标注的评论文本,作为未标注样本;采用标签传播算法预测所述未标注样...
- 李寿山张栋周国栋贡正仙
- 文献传递
- 基于交叉层级注意机制的篇章神经机器翻译方法及系统
- 本发明公开一种基于交叉层级注意机制的篇章神经机器翻译方法,包括:将未处理的语料生成包含文档结构信息的训练语料;使用训练语料训练基础结构的篇章神经机器翻译模型;利用翻译模型获取具有句子边界信息的源端文档句向量集合;将句向量...
- 李军辉陈林卿贡正仙周国栋
- 文献传递
- 融合篇章上下文有效识别的篇章级机器翻译被引量:1
- 2021年
- 篇章翻译是近来兴起的研究热点,如何在翻译文档时充分利用篇章信息一直是该研究的关键点和难点.在篇章级机器翻译中,如何选取当前句的篇章上下文是非常关键的.虽然相关研究使用的篇章上下文不尽相同,但是却少有在选取之前对上下文信息进行识别筛选.本文提出了一种融合篇章上下文有效识别的篇章级翻译模型,引入判别篇章上下文是否有效的分类任务,并根据判别结果来控制目标端对篇章上下文的利用.在中英、英德翻译任务上,与基准系统相比,本模型的翻译性能都得到了显著的提升.
- 汪浩贡正仙李军辉
- 关键词:篇章翻译
- 一种简单的神经机器翻译的动态数据扩充方法被引量:2
- 2021年
- 反向翻译作为一种用于神经机器翻译的数据扩充方法,被广泛应用于单语数据的训练.然而,这些方法通常需要大规模源端或目标端单语数据、双语词典等.基于此,提出了一种在不引入外部资源情况下的简单数据扩充方法.该方法在每次加载目标端句子时,按照一定策略对句子中单词进行随机噪声化,以实现原始平行数据目标端的动态数据扩充,从而提高目标端语言模型对句子的表达能力.不同于需要大量单语数据的反向翻译,该方法只使用平行语料.这一策略意味着不需要训练额外的逆向模型.在英德和中英翻译任务上的实验结果表明,该方法使标准Transformer系统的双语互译评估(BLEU)值分别提高了0.69和0.66个百分点.
- 刘志东李军辉贡正仙
- 利用Package & Development向导制作高级安装程序被引量:1
- 2003年
- 贡正仙
- 关键词:VB语言程序设计WINDOWS应用程序
- 基于网格的Web信息抽取技术的研究与实现
- Web文档往往用各种复杂的HTML标记来包装内部数据,但这种方式给应用系统直接使用Web文档中的数据带来了困难。Web信息抽取是处理海量数据且需要各种复杂算法支持的一种技术,因此它在一般平台上的工作效率不是很好。网格能为...
- 贡正仙
- 关键词:WEB信息抽取噪声处理网格应用GT4
- 文献传递
- 基于相似页面的Web信息抽取系统的实现被引量:16
- 2006年
- 分析了RoadRunner的核心算法,针对RoadRunner的不足,综合自动和半自动抽取阶段的各项研究成果,设计并实现了基于相似页面的W eb信息抽取系统。介绍了系统结构和实现的关键技术,包括如何获取相似页面,可靠的噪声处理和自动归纳抽取规则的算法。
- 贡正仙朱巧明李培峰
- 关键词:WEB页面信息抽取
- 异构数据库的异步迁移工具的实现被引量:1
- 2004年
- 针对目前业界存在着多种异构数据库,而它们之间往往因为系统的升级而要进行数据移植的状况,尝试实现了一个能从MSSQLServer到Oracle的典型异构迁移的自动工具.本文对JDBC在两种数据库的应用进行了详细的阐述,对提高JDBC的执行效率进行了有益的探讨.
- 李蓥陈越贡正仙
- 关键词:JDBC数据移植ORACLEMSSQL
- 一种基于历史信息的自适应动态网格作业调度方法
- 2008年
- 目前,国内外围绕着网格中的作业调度算法已做了大量研究,先后提出了很多调度算法。但是,这些算法并不能很好地适应网格的动态性、自治性和分布性等特征。对此,提出了一种动态的网格作业调度方法—基于历史信息的自适应动态网格作业调度方法ASHI。该方法利用每个资源上最近作业的执行信息自适应调整预测模型,然后再根据网格的动态性和实时性等因素,对资源进行反馈选择后将作业提交负载较轻的资源上执行。实验证明,ASHI不但能及时有效地对作业进行调度,而且还可有效提高整个网格的吞吐量和均衡系统的负载。
- 许兰朱巧明贡正仙李培峰
- 关键词:网格计算作业调度历史信息自适应
- 文档级统计机器翻译的研究
- 机器翻译是自然语言理解中的一个研究热点,能有效地促进信息共享,具有广泛的研究和应用价值。统计机器翻译(Statistical Machine Translation,SMT)是目前主流的机器翻译技术,但孤立进行句子翻译的...
- 贡正仙
- 关键词:系统架构