您的位置: 专家智库 > >

刘京城

作品数:2 被引量:0H指数:0
供职机构:安徽大学更多>>
发文基金:安徽省高校省级自然科学研究项目更多>>
相关领域:自动化与计算机技术更多>>

合作作者

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...

主题

  • 2篇分词
  • 1篇商业情报
  • 1篇数组
  • 1篇中文
  • 1篇中文分词
  • 1篇自动分词
  • 1篇网站
  • 1篇文本挖掘
  • 1篇无词典分词
  • 1篇竞争对手
  • 1篇后缀数组
  • 1篇关联规则

机构

  • 2篇安徽大学

作者

  • 2篇刘京城
  • 1篇刘锋

传媒

  • 1篇计算机技术与...

年份

  • 2篇2011
2 条 记 录,以下是 1-2
排序方式:
一种改进的基于后缀数组的无词典分词方法
2011年
文中改进了基于后缀数组的无词典分词算法。原算法通过对输入字符集建立后缀数组并按字典序进行排列来筛选汉字结合模式形成候选词集,并通过置信度的比较来筛选候选词集以获得分词集。文中改进了其计算候选词出现频率的方法并且大大减少了筛选候选词集时两两判断候选词是否具有父子关系的次数。试验表明,改进的算法能够在没有词典的情况下更快速构建候选词集和筛选候选词集。适用于对词条频度敏感,对计算速度要求较高的中文信息处理。
刘京城刘锋
关键词:自动分词无词典分词后缀数组
竞争对手网站商业情报挖掘
作为一个广泛流行的交流渠道,网络正越来越吸引更多的公司把他们的信息公布到互联网上。随着更多竞争对手的信息公开,对于一个公司而言,得到更多有关竞争对手的商业情报及其竞争优势的机会已然到来。然而,要从竞争对手的网站上找到有价...
刘京城
关键词:文本挖掘竞争对手商业情报关联规则中文分词
共1页<1>
聚类工具0