您的位置: 专家智库 > >

蔡智

作品数:11 被引量:85H指数:4
供职机构:中国科学技术大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术经济管理自然科学总论更多>>

文献类型

  • 7篇期刊文章
  • 3篇会议论文
  • 1篇学位论文

领域

  • 8篇自动化与计算...
  • 1篇经济管理
  • 1篇自然科学总论

主题

  • 3篇知识发现
  • 3篇数据库
  • 3篇互联
  • 3篇互联网
  • 2篇信息抽取
  • 2篇用户
  • 2篇时序数据
  • 2篇中文
  • 2篇网络
  • 2篇聚类
  • 2篇关联规则
  • 2篇抽取
  • 1篇代理
  • 1篇电子商务
  • 1篇信息AGEN...
  • 1篇信息抽取技术
  • 1篇信息过载
  • 1篇信息检索
  • 1篇引擎
  • 1篇英文

机构

  • 11篇中国科学技术...

作者

  • 11篇蔡智
  • 8篇蔡庆生
  • 4篇于琨
  • 3篇王煦法
  • 3篇岳丽华
  • 2篇王熙法
  • 2篇糜仲春
  • 1篇赵心
  • 1篇邹翔
  • 1篇王清毅

传媒

  • 2篇小型微型计算...
  • 2篇计算机科学
  • 1篇计算机研究与...
  • 1篇复旦学报(自...
  • 1篇软件学报
  • 1篇第一届中国R...
  • 1篇第十七届全国...
  • 1篇第五届全国计...

年份

  • 2篇2004
  • 2篇2003
  • 2篇2002
  • 2篇2001
  • 2篇2000
  • 1篇1999
11 条 记 录,以下是 1-10
排序方式:
B2C电子商务中的信息抽取技术被引量:1
2002年
After stepping out the valley of net economy, B2C e-commerce is about to come into a climax of develop-ment. Information extraction techniques are going to be one of the most important factors to promote B2C e-com-merce. In this paper, we present a review on the recent progress of information extraction techniques applied to B2Ce-commerce. The characteristics of each technique are also appraised.
于琨蔡智糜仲春蔡庆生
关键词:B2C电子商务信息抽取网络购物INTERNET
一种网络智能信息Agent——CIRs的设计
2004年
Web上大量、分布、动态的信息,造成了用户在查询Web上的信息时产生"信息过载"和"信息迷向"现象.智能信息Agent是解决此问题的研究热点.设计并实现了一种以智能化、主动搜索为标志的互联网智能信息Agent—CIRs,从用户日常的行为中自动学习出用户兴趣模型,从而为用户提供个性化Web信息服务.
蔡智于琨王煦法蔡庆生
关键词:CIRWEB信息信息过载用户兴趣模型网络智能
基于路径学习的信息自动抽取方法被引量:11
2003年
针对用户需求的网页信息自动抽取是解决互联网信息爆炸问题的一个有效途径 ,然而现有的信息自动抽取方法均难以同时满足网页信息自动抽取中查全率与查准率高、抽取速度快、抽取信息量大和用户负担轻的要求 .本文提出了一种基于路径学习的信息自动抽取方法 ,并采用该方法编制了一个商品价格信息自动抽取系统 .实验结果表明 ,该方法具有用户负担较轻 (只需用户提供 2~ 4个学习实例 )、查全率 (97.0 4~ 10 0 % )与查准率 (99~ 10 0 % )高、可实现大样本量信息抽取和时间资源耗费少 (抽取时间 <1秒 )等特点 ,能基本满足网页信息自动抽取的要求 .
于琨蔡智糜仲春蔡庆生
关键词:互联网
一种数据属性约简算法研究
一、引言在数据库中发现知识(Knowledge Discoveryin Databases,简称KDD),是当前数据库与人工智能领域研究的热点课题,其目标是在数据库中提取隐含的、先前未知的、潜在有用的知识。由于在数据库中...
蔡智岳丽华王熙法
关键词:数据属性约简算法数据库
基于粗糙集理论的连续属性离散化算法研究
本文形式化地给出了采用粗糙熵聚类的基本定义,采用粗糙熵的方法对聚类质量进行评价,给出了能够在任意的全序值属性上自动进行取值聚类的算法,有关实验结果验证了算法的有效性.
蔡智王煦法蔡庆生
关键词:粗糙集粗糙熵离散化算法
文献传递
时序模式发现算法研究被引量:40
2000年
针对时序数据 ,提出一种新的时序模式的逻辑表示法 ,通过分段线性表示法 ,将时序曲线拟合为线段序列 ,从而以相对应的线段的斜率反正切值序列作为模式的逻辑表示 .在此基础上 ,设计出时序模式发现算法 ,此算法能够自动地发现所有 (子 )模式 .有关实验结果证明算法是行之有效的 .
蔡智岳丽华王熙法
关键词:知识发现时序数据数据库
互联网中文信息获取研究(英文)被引量:3
2003年
提出了一种以智能化、主动搜索为标志的互联网中文信息获取方法 ,实现了一种互联网中文信息智能获取工具 ,该工具采用智能Agent的体系结构 ,通过学习用户日常的文档和用户的交互意见推测出用户需求 ,建立个性化的用户模型 .并使用元搜索引擎从互联网上主动获取信息 .最后通过本地智能处理技术 ,剔除合并重复及相似性大的信息 ,将处理后的结果以显明易懂的方式提交给用户 .
蔡智王煦法于琨蔡庆生
关键词:互联网智能代理智能AGENT用户模型元搜索引擎
一种基于关联规则的中文概念集生成算法被引量:5
2004年
本文提出了一种基于关联规则的中文概念集生成算法。该算法首先产生文档的中文关键词集,采用向量空间模型VSM(vector space model)表示文档;然后以中文关键词为事务项,以中文文档为事务,采用成熟的关联规则算法发现中文关键词频繁集;再生成原始概念集并对原始概念集进行聚类,最终实现了中文概念集的自生成.同时该算法能引入增量更新的特性,对概念集进行增量更新。通过实验,表明该算法能有效地生成中文概念集.可以用之于对表示中文文档的高维特征向量的语义降维,具有一定的使用价值。
赵心蔡智洪流蔡庆生
关键词:关联规则文本聚类向量空间模型VSM关键词
部分数据缺失环境下的知识发现方法被引量:25
2001年
介绍了目前的不完全数据环境下的知识发现研究工作 ,分两个部分提出了一个不完全数据库中的知识发现方法 .首先具体讨论了如何猜测丢失的数据 ,给出了基于距离的关联规则的定义及挖掘方法 .然后在此基础上详细描述了一个不完全数据库中的知识发现算法 ,分析了算法的复杂度 ,并给出了相应的实验结果 .最后 。
王清毅蔡智邹翔蔡庆生
关键词:知识发现聚类关联规则数据库
一种基于时序数据的模式发现算法研究
针对时序数据,讨论了时序模式的发现过程,提出一种新的时序模式的逻辑表示法。通过分段线性表示法,将时序曲线拟合为线段序列,从而以相对应的线段的斜率偏离作为衡量模式的相似性程度的尺度。在此基础上,设计出一种时序序列建模算法,...
蔡智岳丽华蔡庆生
关键词:知识发现时序数据
共2页<12>
聚类工具0