您的位置: 专家智库 > >

张劲松

作品数:3 被引量:29H指数:3
供职机构:上海理工大学光电信息与计算机工程学院更多>>
发文基金:上海市教育委员会重点学科基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 2篇中文
  • 2篇中文分词
  • 2篇交集型
  • 2篇交集型歧义
  • 2篇分词
  • 1篇点击
  • 1篇点击付费
  • 1篇验证码
  • 1篇匹配法
  • 1篇中文分词方法
  • 1篇中文分词算法
  • 1篇字符
  • 1篇字符识别
  • 1篇最大匹配法
  • 1篇链长
  • 1篇光学字符
  • 1篇光学字符识别
  • 1篇分词方法
  • 1篇分词算法

机构

  • 3篇上海理工大学

作者

  • 3篇袁健
  • 3篇张劲松
  • 2篇马良

传媒

  • 1篇计算机应用
  • 1篇计算机应用研...
  • 1篇计算机工程与...

年份

  • 3篇2009
3 条 记 录,以下是 1-3
排序方式:
回溯正向匹配中文分词算法被引量:17
2009年
在最大匹配法(The Maximum Matching Method)的基础上,提出了一种回溯正向匹配(The Backtracking Matching Method)的中文分词方法。该方法首先对待切文本进行预处理,将文本分割成长度较短的细粒度文本;利用正向匹配、回溯匹配和尾词匹配来有效发现歧义字段;利用长词优先兼顾2词簇的方式对交集型歧义字段进行切分。最后对该算法进行的定性分析说明了该方法的先进性,从随机抽取大量语料实验结果上证明了该方法的有效性。
张劲松袁健
关键词:中文分词最大匹配法交集型歧义
二次回溯中文分词方法被引量:3
2009年
在最大匹配法(MM)的基础上,提出了二次回溯中文分词方法。该方法首先对待切文本进行预处理,将文本分割成长度较短的细粒度文本;利用正向匹配、回溯匹配、尾词匹配、碎片检查来有效发现歧义字段;利用长词优先兼顾二词簇的方式对交集型歧义字段进行切分,并对难点的多链长交集型歧义字段进行有效发现和切分。从随机抽取的大量语料实验结果上证明了该方法的有效性。
袁健张劲松马良
关键词:中文分词交集型歧义
一种有效预防点击欺诈的策略被引量:10
2009年
网络广告中,点击欺诈愈演愈烈,使得搜索引擎企业以及点击付费模式遭到质疑。点击欺诈已经成为阻碍网络广告业健康发展的一大顽疾。针对网络广告业发展所面临的困境,提出一种基于图形验证码的预防点击欺诈策略。该策略能有效屏蔽类似于木马点击器软件的欺诈点击,有效屏蔽浏览者偶然的无意识的无效点击,显著降低人工欺诈点击的效率。
袁健张劲松马良
关键词:点击付费光学字符识别验证码
共1页<1>
聚类工具0