张均胜
- 作品数:51 被引量:143H指数:8
- 供职机构:中国科学技术信息研究所更多>>
- 发文基金:国家自然科学基金国家社会科学基金中国博士后科学基金更多>>
- 相关领域:文化科学自动化与计算机技术天文地球语言文字更多>>
- 多语言科技语料库建设研究
- 2015年
- 多语言科技语料库建设的重要意义在于它能够服务于多语言科技文献信息的组织、科技文献的自动翻译,以及科技文献的情报分析等。科技语料库的建设采用的主要技术方法是运用自然语言处理和计算机处理技术实现语料的采集、自动加工和处理。本文介绍多语言科技语料库建设方面的相关研究工作,主要涉及多语言词表、平行语料的获取与处理,及多语言语法资源的建设等方面的工作成果。研究工作的不足之处在于语料库的数据资源和语法资源的质量和规模有待于提高和完善。
- 曾文张均胜徐红姣李颖刘敏屈鹏刘丹
- 关键词:多语言语料库
- 一种科技创新数据的图谱构建方法及装置
- 本公开公开了一种科技创新数据的图谱构建方法和装置,其中,方法包括:从多类型的科技创新数据源中采集多种类型的科技创新数据;对所述科技创新数据进行实体以及实体关系的抽取,并进行实体的地理信息的识别;根据所述实体关系对不同类型...
- 姚长青刘志辉杨岩张均胜张兆锋
- 中心语驱动短语结构语法研究综述被引量:3
- 2013年
- 系统介绍国外中心语驱动短语结构语法(HPSG)的研究成果,包括理论思想的早期建立,形式化处理的后续完善,相关语言技术的实际应用,以及在中文语法设计方面的探索工作,最后根据当前研究趋势展望中文HPSG的应用发展方向。
- 范子衿王惠临张均胜
- 汉语文本中事件之间时间关系分析试验研究
- 针对文本进行分析,抽取文本中的事件和时间,并建立事件之间的时间关系是对文本内容进行分析和时序挖掘的基础.本文基于ISO-TimeML标准进行汉语文本时间关系解析研究.本研究工作利用TimeBank语料库和前期构建的Chi...
- 李路标张均胜王惠临
- 关键词:汉语文本语料库
- 基于科技文献的科技创新供需矩阵构建及评估应用研究
- 2023年
- [目的/意义]通过科技创新供需矩阵构建及矩阵评估研究,探究科技文献集合对应研究领域内科技创新供需状况,发现研究热点,预测研究趋势,辅助研究机会发现.[方法/过程]提出一种基于科技文献的科技创新供需矩阵,并将其应用于科技创新供需状况评估.该方法将科技文献中的研究问题与研究方法映射到需求与供给并形成矩阵表示,对矩阵维度进行组织排序,依据研究问题与研究方法的共现关系开展矩阵供需状况评估.实验结果显示,该方法具有可行性与有效性.[结果/结论]基于研究问题和研究方法对科技文献文本进行细粒度知识单元关联分析,构建科技创新供需矩阵,有助于分析相关领域研究状况,了解研究进展与趋势,发现潜在研究机会.
- 朱宇寒张均胜乔晓东张吉玉
- 跨语言信息检索研究进展
- 2014年
- 文章从研究意义、研究热点和发展方向这三个角度对跨语言信息检索技术进行了较为全面的梳理。关注跨语言检索的含义和研究意义,使我们清晰地看到它从产生到发展的深刻社会需求背景和相关技术背景;关注跨语言检索的关键技术发展,使我们了解该项技术如何将繁多的网络资源用不同的语言提供给需要的用户,如何用可互换的语言形式描述相同或相似内容的信息资源;最后也是最重要的,是跨语言检索技术的未来,研究者们清醒地认识到技术和市场的关系,"从研究到实践",跨语言检索技术还有很长的路要走。建立以用户为中心、快速高质量、资源丰富、实用化多语言信息获取系统是未来的发展目标。
- 高影繁王惠临徐红姣张均胜屈鹏
- 关键词:跨语言信息检索
- TimeML应用于汉语文本时间关系标注的可行性分析
- 2014年
- 【目的】对TimeML应用于汉语文本时间关系标注的可行性进行研究并验证。【方法】基于TimeML标准及其主要标签,针对汉语时间表达的特点,探讨主要标签在汉语中的适用性。【结果】虽然汉语语言和英语语言在语法结构和句法结构上存在差异,但是TimeML标准在汉语上的应用是可行的。【局限】英汉语言结构的不同导致在TimeML五个主要标签中涉及语法结构的属性在英汉对译文本之间不能完全平行实现。【结论】TimeML作为英文时间关系标记语言,可以有效地应用于汉语文本时间关系的标注。本研究为汉语文本中事件时序推理及深层次的汉语文本时间关系解析研究奠定了基础。
- 李路标张均胜张寅生王惠临
- 关键词:汉语
- 中日两国机器翻译研究进展及比较被引量:3
- 2011年
- 机器翻译研究用计算机实现不同自然语言之间的翻译。自第一台计算机诞生开始,人们一直在研究和探索高质量高效率的机器翻译技术。近年来,基于规则的机器翻译、基于实例的机器翻译和基于统计的机器翻译这几种主要的翻译模式共同存在且相互补充,并有不断融合之势。随着中国和日本在科技、经济和文化交流的不断深入,机器翻译研究对于打破汉语和日语之间的语言壁垒进而推进中日两国各个领域的交流与合作具有重要的应用价值。中国和日本两国机器翻译研究人员已经开展了大量的汉日/日汉机器翻译的理论研究与系统研制,已取得了有效的成果,但距离大规模实际应用和高标准的翻译质量的要求尚有差距。为此,中日两国机器翻译人员有必要在汉日/日汉机器翻译技术与系统研制方面展开合作,特别是在对齐平行文本、实例词典、专业术语词典以及句法分析等共同课题方面展开合作。文章介绍了中日两国机器翻译研究的进展并加以比较,对中日两国在机器翻译领域的合作做了分析与展望。
- 张均胜何彦青李颖王惠临
- 关键词:机器翻译
- 机器翻译系统融合方法及其应用探究
- 2011年
- 多机器翻译系统融合技术能够对不同机器翻译系统的输出结果有效地进行融合,产生更好的翻译性能,因此该技术成为机器翻译研究领域的一个热点问题。文章介绍了中国科学技术信息研究所(ISTIC)参加第七届全国机器翻译研讨会机器翻译评测的情况。本单位参加了英汉科技领域的机器翻译评测项目。文章阐述了本单位机器翻译系统的实现框架以及实施细节,并分析了它们在评测数据上的性能表现,最后对机器翻译系统融合方法目前的现状进行讨论,并对该系统融合方法进行总结和展望。
- 何彦青石崇德于薇张均胜王惠临
- 关键词:机器翻译自然语言处理
- 基于跨语言文本分类的多语资源组织方法研究
- 跨语言文本分类技术是指在不需人工干预的情况下将现有的自动文本分类系统由单语言扩展到两种或多种语言。当机构或组织的文档管理部门日益依赖自动文本分类时,跨语言文本分类技术能为其解决多语种文档的归类组织问题提供支持。本文以国家...
- 高影繁徐红姣张均胜王惠临
- 关键词:快速分类算法