国家自然科学基金(70701026)
- 作品数:15 被引量:74H指数:6
- 相关作者:郭均鹏李汶华解百臣高峰吴育华更多>>
- 相关机构:天津大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金天津市哲学社会科学研究规划项目更多>>
- 相关领域:理学经济管理自动化与计算机技术更多>>
- 改进的基于符号数据的协同过滤推荐算法被引量:3
- 2011年
- 随着用户和资源种类的不断增加,评价矩阵的稀疏性问题越来越突出,严重影响了推荐系统的推荐质量。奇异值分解(SVD)是一种对数据进行降维处理的方法,符号数据分析(SDA)是一种处理海量数据的全新数据分析思路。提出一种改进的基于符号数据的协同过滤推荐算法,即将奇异值分解和符号数据分析方法结合起来运用到推荐系统中。在EachMovie数据库集上的实验结果表明该算法在数据稀疏时的推荐质量明显优于传统的推荐算法。
- 郭均鹏陈莹莹
- 关键词:协同过滤奇异值分解稀疏性推荐系统
- 股票综合评价的符号数据PCA方法被引量:2
- 2009年
- 符号数据分析是一种新兴的数据挖掘技术,区间数是最常用的一种符号数据。研究应用区间型符号数据的PCA方法来评价股票的市场综合表现问题。首先介绍了符号数据分析的基本理论。接下来研究了区间数据样本的经验描述统计量的计算,并基于经验相关矩阵,给出了区间主成分分析的算法,该算法最终得到区间数表达形式的主成分取值。最后选取上海证券交易市场20支股票在某一周上的交易数据,进行了实证研究,基于区间主成分得分的矩形图表示,将20支股票按其市场综合表现分成了四类。
- 李汶华郭均鹏
- 关键词:主成分分析区间数股票
- 一种区间PCA的效度分析方法被引量:6
- 2009年
- 关于区间数据的主成分分析(PCA)方法已取得了较丰富的研究成果,但少见对这些方法效度的评价研究.针对该问题,基于Hausdorff距离用于定义两个紧集之间距离的考虑,将区间数视为一个紧集,定义了区间数之间的距离,并研究了区间矩阵的距离.在此基础上,根据PCA方法的原理,建立了一个区间PCA方法的效度评价指标.该指标取值在0与1之间,其取值越大,说明区间PCA方法效度越高,反之则效度越小.最后,采用模拟的方法,分别选取均匀分布和正态分布两种类型的区间数据样本,对目前最常用的两种区间PCA方法——顶点法和中点法进行了效度分析,验证了文中所提的效度指标的正确性.
- 郭均鹏李汶华
- 关键词:区间数主成分分析HAUSDORFF距离
- 基于区间分析的项目经济评价被引量:6
- 2008年
- 针对项目经济评价中存在的不确定性,提出了基于区间分析的项目经济评价方法。区间分析是以"区间数"为处理对象的一种不确定性数学分析方法。当各要素(如现金流、贴现率等)为区间数时,研究了求解区间净现值和区间内部收益率的方法,给出了通过区间净现值和区间内部收益率进行项目经济评价的规则,并研究了这2种方法。结果表明,在进行项目经济评价时,2种方法本质是一致的。
- 郭均鹏吴育华
- 关键词:区间分析净现值内部收益率
- 我国寿险企业生产效率变动的Malmquist指数分析被引量:2
- 2010年
- 运用Malmquist指数方法,对我国寿险行业1999—2007年的面板数据进行实证分析。结果表明,由于规模效率和纯技术效率的波动性,造成资源配置效率对全要素生产率的变动贡献不明显,我国寿险行业的生产效率变动主要是由技术变动引起的,技术进步是促进寿险行业效率增长的决定性因素。
- 高明解百臣
- 关键词:全要素生产率MALMQUIST指数技术进步
- 区间型符号数据回归分析及其应用被引量:13
- 2010年
- 介绍了符号数据分析方法的基本理论.针对一种最常用的符号数据——区间型符号数据,基于误差传递的理论,提出了区间回归分析的方法.方法包括了线性回归分析和可线性化的非线性回归分析两种情形.讨论了基于Hausdorff距离的区间数距离,基于此定义了回归模型的评价指标.进行了方法的应用研究,选取沪深300指数与中信规模风格指数,从时间维上对其日内数据进行"数据打包",形成区间型符号数据;建立了区间线性回归分析模型,从全局上揭示了两类指数间的相关性.结论表明,与针对点数据的传统回归分析相比,区间型符号数据的回归分析方法不仅实现了样本空间的降维,而且有利于从整体上把握变量之间的内在关系.
- 李汶华郭均鹏
- 关键词:区间数
- 区间主成分分析方法的比较被引量:12
- 2008年
- 简述了区间数据主成分分析(PCA)的两种主要方法——顶点法(V-PCA)和中点法(C-PCA),并对其进行了合理化改进。研究表明,两种方法的协方差矩阵有极大的相似性。在研究区间数距离的基础上,定义了一种基于Hausdorff距离的评价模型方法优劣的效度指标,并通过模拟的方法,对这两种方法进行了比较研究。结果表明:两种方法具有较强的相似性;随着变量数和样本数的增加,两种方法的效度均有所下降;在同样的样本数条件下,中点法适合变量数较大的情形,而顶点法更适合于变量数较小的情形。最后,给出了区间PCA方法选择及效度测量的应用步骤和一个算例。
- 李汶华郭均鹏
- 关键词:区间数主成分分析
- 一般分布区间型符号数据的描述统计与分析被引量:16
- 2011年
- 以对大规模个体数据通过打包形成的区间型符号数据为研究对象,针对个体在区间内往往不服从均匀分布的实际情况,研究一般分布的区间型符号数据的描述统计和分析方法.对符号数据分析进行了概述,并定义了一般分布的区间变量.研究了一般分布的区间变量的经验分布函数和经验联合分布函数.在此基础上,讨论了一般分布区间变量的描述统计量的求解.最后给出了算例,运用一般分布区间型符号数据的因子分析方法.以中国股市为背景进行了应用研究.结论表明:以往研究基于均匀分布假设所给出的描述统计量的计算,可看作文中所给求解公式的特例.另外,研究方法基于经验分布理论,无需知道个体在区间内服从分布函数的具体表达式,且在计算过程中充分利用了区间内的个体信息.
- 郭均鹏李汶华高峰
- 关键词:区间数据描述统计
- 基于区间分析的投资组合VaR计算新方法被引量:3
- 2013年
- 基于区间分析估计变量的累计概率分布是进行风险价值分析的一种新方法。本文将区间分析运用到股票投资组合的VaR计算中,研究区间分析在VaR计算方法中的应用。首先给出了基于区间分析估计分布函数的计算步骤,然后将区间分析运用到VaR的计算中,以两只股票的投资组合为例得出收益率的累计概率分布,从中得到某一置信度下的VaR值,最后与蒙特卡洛模拟方法做了比较研究,结果表明,基于区间分析的VaR计算方法的运算精度和计算速度明显优于蒙特卡洛模拟方法。
- 李汶华于珊珊郭均鹏
- 关键词:区间分析VAR区间数据投资组合
- 区间多目标线性规划的模糊求解方法被引量:5
- 2008年
- 研究基于Zimmermann方法的区间多目标线性规划(IMOLP)的模糊求解方法。首先,将IMOLP化为一个参数规划,通过变量替换化为传统多目标线性规划,然后应用Zimmermann方法进行求解,得到含各目标函数总满意度变量的一个线性规划,并最终将其化为一个单目标的区间线性规划。基于此,分别求得IMOLP最大总满意度和最小总满意度下的Pareto解,并求出各目标函数的最优值区间。最后,给出算例。
- 郭均鹏李汶华
- 关键词:区间数多目标线性规划