罗阳
- 作品数:3 被引量:5H指数:1
- 供职机构:沈阳航空航天大学更多>>
- 发文基金:辽宁省教育厅高等学校科学研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向单一双语网页的双语资源挖掘方法被引量:5
- 2011年
- 双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规模很难满足实际应用的需要。该文提出一种面向单一双语网页的双语资源挖掘方法,该方法重点采用了以频繁序列模式为特征的SVM分类方法,实现了包含双语资源的单一双语网页的筛选与识别,并以此为基础挖掘具有对译的双语资源。实验结果表明,该方法能够有效改进双语资源挖掘的质量。
- 罗阳季铎张桂平王莹莹
- 关键词:WEB挖掘网页分类频繁序列模式支持向量机
- 面向单一网页的双语资源挖掘方法
- 双语资源是机器翻译和跨语言信息检索等领域的重要资源,但是由于语料库真实性、时效性和语种灵活性等问题,使得现有的双语资源的规模很难满足实际应用的需要。本文提出一种面向单一双语网页的双语资源挖掘方法,该方法与现今平行网页的双...
- 罗阳季铎张桂平王莹莹
- 关键词:WEB挖掘网页分类频繁序列模式支持向量机
- 文献传递
- 基于Web数据的双语资源挖掘技术研究
- 随着统计方法在自然语言处理中的广泛应用,双语语料库资源对于自然语言处理研究的巨大价值已经得到越来越多的认可,尤其在机器翻译、跨语言信息检索和双语术语翻译等领域具有不可或缺的重要作用。以互联网为数据源挖掘双语资源可以有效解...
- 罗阳
- 关键词:WEB挖掘频繁序列模式网页分类
- 文献传递