石崇德
- 作品数:28 被引量:80H指数:5
- 供职机构:中国科学技术信息研究所更多>>
- 发文基金:国家自然科学基金国际科技合作与交流专项项目北京市重点学科建设基金更多>>
- 相关领域:自动化与计算机技术文化科学语言文字更多>>
- 一种基于判别随机场模型的行为建模方法
- 本文提出了一种基于判别式随机场模型的行为建模方法。在条件随机场模型的基础上,引入基于行为的隐藏特征函数和时间窗口参数,从而将其扩展到空间和时间的领域中,并设计了有效的特征模板和行为识别方法。由于模型具有基于条件的结构,该...
- 黄天羽石崇德李凤霞
- 关键词:CRF
- 文献传递
- 面向科技文献神经机器翻译词汇表优化研究被引量:2
- 2019年
- 【目的】针对面向科技文献的神经机器翻译中存在的词汇表受限问题,提出优化方法,进而提升翻译质量。【方法】根据科技词汇构词规律,结合点互信息,在保留词汇义素完整的同时,对神经机器翻译词汇表进行优化,达到减少未登录词的目的。【结果】选择NTCIR-2010专利语料和自动化计算机领域期刊论文摘要语料进行实验,将实验结果与普通分词和子词分词对比,证明该方法的有效性。【局限】仅考虑中文字符的优化。【结论】在中文科技文献领域,基于科技词汇构词的词汇表优化方法能够提升翻译效果。
- 刘清民姚长青石崇德温晓洁孙玥莹
- 关键词:未登录词
- 本体驱动的汉英机器翻译研究
- 在基于知识的机器翻译(Knowledge-basedMachineTranslation)中,语义的表达与分析占据着非常重要的地位,然而经过多年的探索,这个问题仍然没有得到有效的解决。而本体的出现为解决这个问题提供了新的...
- 石崇德
- 关键词:机器翻译语义分析本体汉英翻译
- 文献传递
- 树转录翻译模型解码优化
- 2013年
- 针对树转录翻译模型中的规则二元化和解码算法进行深入研究,通过四分化的二元化转换方法减少词汇化同步转录规则的中间项目,通过实时判断中间项目有效性的RR-CKY算法来避免冗余项目生成。实验证明,这两种方法能有效减少解码过程中的中间项目,提高机器翻译解码效率,在一定程度上提高机器翻译效果。
- 石崇德乔晓东王惠临
- 关键词:机器翻译句法分析
- 面向科技文献的中日机器翻译合作研究被引量:2
- 2017年
- 本文以多语言科技信息服务为立足点,结合中日两国面向科技文献的机器翻译研究现状,介绍了两国近几年开展的机器翻译合作项目的情况,包括合作背景与基础、知识产权、具体合作内容与成果,以及在机器翻译实用化方面的一些思考。
- 赵志耘石崇德何彦青高影繁姚长青
- 关键词:机器翻译
- 中国科学技术信息研究所CWMT'2013技术报告
- 本文介绍了中国科学技术信息研究所(ISTIC)参加第九届全国机器翻译研讨会机器翻译评测的情况。本单位参加了英汉科技、英汉新闻两个领域的机器翻译评测项目。本文阐述了本单位机器翻译系统的实现框架以及实施细节,并分析了它们在评...
- 何彦青石崇德张均胜王惠临
- 关键词:机器翻译自然语言处理
- 面向技术机会发现TOD的专利信息抽取——韩国科学技术信息研究院KISTI语义服务被引量:3
- 2015年
- 技术机会发现(TOD,Technology Opportunity Discovery)是面向新技术进行监测,并提供机会的一种服务;所谓"基于专利的信息"是指采用自然语言技术对专利进行抽取的结果。本研究的目标资源覆盖过去20年间发表的所有专利,目标信息则是其中产品名称及其部分-整体关系(Part-of relations)。应用基于词典和相似度的命名实体识别、基于模式的关系抽取、以及基于机器学习的信息过滤几项技术,本研究取得了令人鼓舞的效果。
- 周雷李颖石崇德
- 关键词:自然语言处理信息抽取
- 机器翻译系统融合方法及其应用探究
- 2011年
- 多机器翻译系统融合技术能够对不同机器翻译系统的输出结果有效地进行融合,产生更好的翻译性能,因此该技术成为机器翻译研究领域的一个热点问题。文章介绍了中国科学技术信息研究所(ISTIC)参加第七届全国机器翻译研讨会机器翻译评测的情况。本单位参加了英汉科技领域的机器翻译评测项目。文章阐述了本单位机器翻译系统的实现框架以及实施细节,并分析了它们在评测数据上的性能表现,最后对机器翻译系统融合方法目前的现状进行讨论,并对该系统融合方法进行总结和展望。
- 何彦青石崇德于薇张均胜王惠临
- 关键词:机器翻译自然语言处理
- 中文科技文献切分的领域适应技术研究
- 2014年
- 以生物医学文献为实例对象,研究科技文献切分中的领域适应技术,通过以词典特征、领域词汇特征、子串标注和使用词典切分的粗切分语料作为训练语料等方法,实现基于序列标注的中文切分方法由新闻领域到科技领域的适应,并取得了较好的效果。研究表明,在科技文献切分中,充分利用领域知识获取领域相关特征,对于提高科技文献切分的准确率具有重要的作用。
- 石崇德乔晓东王惠临屈鹏
- 一种基于短文本相似度计算的主观题自动阅卷方法被引量:12
- 2014年
- 文本主观题自动阅卷的关键是提高考生答案文本和试题标准答案文本之间相似度计算结果的准确率。参考文本试题人工阅卷方法,提出一种结合人工制定文本相似标准、词语集合及词语次序和同义词的短文本相似度计算方法,设计并实现相应文本主观题阅卷系统。建立试题人工评分标准库,并在387道银行培训领域真实考题数据集上进行自动阅卷与人工阅卷结果对比实验。结果显示,文本试题自动阅卷结果与人工阅卷结果相比,完全相同的达到58%,准确率达到80%左右。
- 张均胜石崇德徐红姣高影繁何彦青
- 关键词:相似度主观题自动阅卷