教育部人文社会科学重点研究基地度重大研究项目(05JJD910001)
- 作品数:28 被引量:272H指数:7
- 相关作者:吴喜之陈凯魏传华李育安吴孟书更多>>
- 相关机构:中国人民大学中央民族大学中国人民武装警察部队学院更多>>
- 发文基金:教育部人文社会科学重点研究基地度重大研究项目国家自然科学基金全国统计科学研究计划项目更多>>
- 相关领域:理学经济管理自动化与计算机技术环境科学与工程更多>>
- 基于遗传算法的投影寻踪聚类被引量:4
- 2008年
- 传统的投影寻踪聚类算法PROCLUS是一种有效的处理高维数据聚类的算法,但此算法是利用爬山法(Hill climbing)对各类中心点进行循环迭代、选取最优的过程,由于爬山法是一种局部搜索(local search)方法,得到的最优解可能仅仅是局部最优。针对上述缺陷,提出一种改进的投影寻踪聚类算法,即利用遗传算法(Genetic Algorithm)对各类中心点进行循环迭代,寻找到全局最优解。仿真实验结果证明了新算法的可行性和有效性。
- 吴孟书吴喜之
- 关键词:投影寻踪聚类算法遗传算法
- 分位数回归及应用简介被引量:88
- 2006年
- 文章介绍了分位数回归法的概念、算法及主流统计软件R和SAS计算时的语法,并通过实例与以普通最小二乘法为基础的线性回归进行了对比,展现了分位数回归的巨大魅力。
- 李育安
- 关键词:最小二乘法分位数回归恩格尔曲线
- 广义卡方型混合分布的鞍点逼近被引量:5
- 2008年
- 广义卡方型混合分布在许多非参数检验问题中有着广泛运用。通常采用正态分布近似这类分布,但是在非大样本的情况下,正态近似的效果并不理想。运用鞍点逼近技术近似广义卡方型混合随机变量的密度函数和分布函数,并且与正态近似方法以及卡方近似方法进行了比较。模拟表明鞍点逼近效果要优于其余两种方法,特别是密度函数尾部区域。
- 罗玉波田茂再吴喜之
- 关键词:鞍点逼近
- 一种改进的集成混合遗传算法被引量:2
- 2008年
- 文章针对传统的遗传算法的早熟现象(即很快收敛到局部最优解而不是全局最优解),提出了一种将传统优化方法以及模拟退火算法与遗传算法相结合的新思路,即分别在无约束问题和有约束问题两种情况下,采用下降算法和模拟退火算法与遗传算法相结合的混合遗传算法;并将此混合算法应用于实际问题求解中,实验表明该算法具有全局最优性和收敛性。
- 陈凯马景义温慧博
- 关键词:遗传算法混合遗传算法
- 基于聚类技术的集成学习差异性研究
- 2008年
- 目前,集成学习特别是选择性集成学习研究已经成为统计机器学习研究的一大热点,从众多的个体学习器中选择差异大且效果好的进行集成已被学术界达成共识,但如何度量个体学习器彼此之间的差异性依然是一个难点。本文提出了一种利用变相似度聚类技术来进行选择性集成学习的算法——SE-Bagging Trees算法。模拟数据表明,该算法往往比简单集成学习算法具有更好的学习效果。
- 陈凯
- 关键词:分类回归树自助法
- 空间自回归模型的局部影响分析和运用被引量:3
- 2008年
- 由于空间数据的相依特性,使得通常的删除点诊断异常值的方法不适合采用。为了寻找数据中的异常点和影响点,采用局部影响分析技术,通过引入扰动的方法来发现影响点,最后通过实例说明局部影响分析技术能够有效地发现模型中可能的影响点,并且能够揭示更多的细节信息。
- 罗玉波吴喜之
- 关键词:空间自回归模型异常点
- 基于模糊的投影寻踪算法在中医证候分类中的应用被引量:9
- 2009年
- 本文提出一种新的聚类算法-基于模糊的投影寻踪算法,可以有效的处理医学中常常遇到的高维混合数据的模糊聚类问题.并将其应用在慢性肾衰的辩证分析问题中,为已有的慢性肾衰证候的分型标准提供科学支持.本文的研究方法为中医辩证的现代化研究开拓了新的思路,值得进一步深入探讨。
- 吴孟书吴喜之
- 关键词:模糊聚类
- 非参数协方差分析基于变系数模型的统计推断被引量:1
- 2006年
- 对于一类协方差分析模型,本文基于变系数模型的角度,提出了约束局部加权核估计方法,并构造了相应的检验统计量,给出了计算检验p-值的精确方法.最后通过数值模拟验证了所提检验方法的有效性.
- 魏传华吴喜之
- 关键词:变系数模型
- 基于关联规则的个体化推荐在传统商业中的应用被引量:2
- 2007年
- 随着互联网与电子商务的发展,个性化网页的设计应运而生。本文从多产品(包括服务)提供商角度出发,以数据挖掘关联规则理论为基础,总结了“个性化推荐”在多产品提供商中的应用。推荐计算过程主要有四步:构建知识集;基于客户已知信息的筛选规则;对每个候选产品计算总评分;选择最终推荐产品。并指出:知识集不仅包括历史数据关联规则集,也包括业务知识集;评分可以根据具体业务选择合适的规则度量(置信度、lift值等);按照某些准则得到各候选产品的总评分;这些准则包括加权平均、最大值、最小值等;根据一些诸如评分大小等标准确定最终推荐产品。从一个例子,本文描述了个性化推荐过程。
- 吴喜之闫洁苏立民钟云飞
- 关键词:关联规则个性化推荐
- 混合地理加权回归模型的统计诊断被引量:6
- 2009年
- 混合地理加权回归模型作为一类能简单有效解决空间非平稳问题的数据分析方法已经得到了广泛的应用。在利用该模型分析实际数据时,一个或多个特殊观测点的存在能导致估计结果发生较大改变。为了能有效检测出异常点,系统研究这类半参数模型的统计诊断与影响分析。首先基于数据删除模型定义了参数分量对应的Cook统计量,其次,基于均值漂移模型讨论了异常点的检验问题,构造了相应的检验统计量。
- 魏传华吴喜之
- 关键词:COOK距离均值漂移模型