杨灿
- 作品数:3 被引量:43H指数:3
- 供职机构:香港科技大学更多>>
- 发文基金:国家自然科学基金浙江省重大科技专项基金浙江省国际科技合作项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 近邻自适应局部尺度的谱聚类算法被引量:4
- 2012年
- 针对尺度参数选取对使用高斯核函数的传统谱聚类算法性能的影响,提出一种以近邻自适应局部尺度代替全局统一尺度的新谱聚类算法。该算法在数据聚类一致性特征的基础上,首先强调局部尺度的灵活性,即每个样本数据对应一个尺度参数,克服了传统方法中所有样本对应单一全局尺度参数的局限性,更好地刻画数据集的本征结构。其次注重参数选取的便捷性,即通过对样本周围Ⅳ个近邻计算加权距离和作为局部尺度的值,从而实现了尺度参数的自动选取。从理论和实验两个角度阐述该算法不仅对离群点有一定的抑制作用,而且能对尺度分布不同的数据类进行准确聚类。最后,在人工数据集和UCI数据集上验证了该算法的有效性。
- 孔万增孙昌思核张建海胡三清杨灿
- 关键词:谱聚类
- 基于本征间隙与正交特征向量的自动谱聚类被引量:36
- 2010年
- 针对经典谱聚类算法无法自动确定数据类个数的问题,本文提出了一种基于本征间隙与正交特征向量的自动谱聚类算法.该方法利用样本数据构建亲和度矩阵,然后进行谱分解得到相应的特征值和特征向量,对特征值从大至小依次排序,用本征间隙来刻画相邻特征值之间的差,通过第一个极大本征间隙出现的位置来自动确定类个数,最后以特征向量之间的夹角作为相似度和已获得的类个数相结合来实现数据分类.本文算法的正确性在人造数据库上得到了验证,并在UCI数据库上与k-means、FCM、Jordan算法进行了分类准确性比较实验,结果表明本文方法比其他三种方法的分类准确率更高.
- 孔万增孙志海杨灿戴国骏孙昌思核
- 关键词:谱聚类
- 基因大数据的集成分析被引量:3
- 2019年
- 随着生物科技(如基因芯片和测序技术)的飞速发展,全世界已经积累了海量的数据。有效地整合和集成多层面和多维度的基因大数据,对于全方位解析从遗传变异到疾病发生的整个因果链条具有关键作用,可为个性化、精准医疗服务奠定科学的基础。从3个方面对基因大数据的集成分析进行综述:检测风险位点及其功能分析、基因多效性的分析、基于孟德尔随机化的因果推断。进一步结合具体的应用案例进行了阐述,最后对基因大数据的集成分析研究进行了总结以及展望。
- 胡湘红彭衡杨灿张纵辉万翔罗智泉
- 关键词:GWAS