您的位置: 专家智库 > >

国家高技术研究发展计划(2006AA01Z153)

作品数:2 被引量:13H指数:1
相关作者:刘昌平郭育生黄磊谭怒涛更多>>
相关机构:中国科学院自动化研究所更多>>
发文基金:国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇动态规划
  • 1篇印刷体
  • 1篇印刷体数学公...
  • 1篇人工智能
  • 1篇中文
  • 1篇中文文档
  • 1篇字符
  • 1篇字符识别
  • 1篇文档
  • 1篇模式识别
  • 1篇混合模型
  • 1篇候选
  • 1篇高斯
  • 1篇高斯混合
  • 1篇高斯混合模型

机构

  • 2篇中国科学院自...

作者

  • 2篇黄磊
  • 2篇郭育生
  • 2篇刘昌平
  • 1篇谭怒涛

传媒

  • 1篇计算机研究与...
  • 1篇中文信息学报

年份

  • 1篇2008
  • 1篇2007
2 条 记 录,以下是 1-2
排序方式:
基于多候选的数学公式识别系统被引量:13
2007年
提出了一种基于多候选方法的数学公式识别系统.该系统主要包括公式图像预处理,多候选公式符号分割和多候选公式结构分析3个部分.在公式符号切分中,使用3次动态规划方法对公式图像进行多候选公式符号切分.在公式结构分析中,采用层次结构方法多候选分析公式符号间的结构关系,然后使用LaTex格式和MathType格式表示数学公式的识别结果.为了确定符号间的空间位置关系,建立了符号的空间关系模型.在3268个公式图像组成的测试集上取得了78.2%的公式分析正确率.
郭育生黄磊刘昌平
关键词:印刷体数学公式动态规划
一种中文文档的数学公式定位方法
2008年
为了从中英文混排的中文文档中定位数学公式,提出了一种基于中文字符识别和公式符号识别的数学公式定位方法。该方法主要由中文字符提取、内嵌公式提取和独立公式定位三个部分组成。在中文字符提取中,首先提取字符块信息:中文字符识别结果、公式符号识别结果和字符块的几何特征,然后使用决策树的方法区分中文字符和非中文字符。在内嵌公式提取中,使用公式符号的语义信息、符号间的角标关系和公式的语义信息等从非中文字符中定位内嵌公式。在独立数学公式定位中,对包含较多内嵌公式符号且不包含中文字符的文字行提取版式结构特征,并使用高斯混合模型区分独立公式和普通文字行。在148幅文档图像共包含3 690个公式组成的测试集上取得了91.19%的公式定位正确率。
郭育生谭怒涛黄磊刘昌平
关键词:人工智能模式识别中文文档字符识别高斯混合模型
共1页<1>
聚类工具0