上海市青年科技启明星计划(11QA1402900) 作品数:10 被引量:18 H指数:3 相关作者: 孔薇 牟晓阳 杨旸 王娟 宋红胜 更多>> 相关机构: 上海海事大学 生物化学系 更多>> 发文基金: 上海市青年科技启明星计划 国家自然科学基金 上海市教育委员会创新基金 更多>> 相关领域: 生物学 医药卫生 化学工程 更多>>
基于大脑不同区域的阿尔茨海默症基因表达数据分析 被引量:2 2013年 提出了采用Tukey双权函数作为FastICA(Fast Independent Component Analysis)方法的非线性函数,对阿尔茨海默症(Alzheimer’s disease,AD)多个脑区域基因表达数据进行显著基因提取,揭示其基因表达调控关系.针对传统聚类方法基于全局聚类且只能将某个基因聚类到某一类的缺陷,改进的FastICA方法能够对基因表达数据进行快速有效的双向聚类,能够满足同一个基因可能参与不同信号传导通路的生物特性.同时考虑到人脑中海马区、内嗅皮质区、颞中回及视觉皮层区均与学习与记忆功能密切相关,将算法对多个脑区域进行基因表达调控综合分析.结果表明,大量炎症反应是AD致病的重要因素之一. 孔薇 牟晓阳关键词:阿尔茨海默症 基因调控网络 基于EFICA的AD微阵列数据基因网络分析 2012年 将EFICA(Efficient Variant of Algorithm FastICA)方法与基因网络相结合分析一组阿尔茨海默病(AD)微阵列数据.根据分类结果提取特征基因集并探寻与早期AD相关的基因网络,实验结果表明,EFICA方法比传统的Fastica方法能够获得更好的分类效果.并且通过对基因网络的研究,扩展了EFICA在生物信息学中的应用,为AD疾病的进一步研究提供新思路. 孔薇 宋红胜关键词:阿尔茨海默症 基因网络 乳腺癌组织学分级下目标基因提取及转录调控网络构建 被引量:2 2014年 目的乳腺癌类型和分级多样性导致其预后差别显著,探寻乳腺癌不同分级情况下的基因表达差异及调控关系能够为乳腺癌致病机制的发现提供重要依据。方法对不同分级下的乳腺癌基因表达数据利用快速独立成分分析(FastICA)方法提取特征基因,并结合人类蛋白质相互作用(PPI)数据选取目标基因。在此基础上,结合转录因子对靶基因调控的先验信息,利用网络成分分析(NCA)方法对与乳腺癌发病有密切关系的转录因子及其靶基因构建转录调控网络。结果筛选出的基因经过数据库验证与乳腺癌相关的占48.15%,构建的调控网络发现了多个转录因子及靶基因在不同分级情况下的活性变化趋势。结论 FastICA算法结合PPI数据提取目标基因的方法较为有效,通过NCA算法构建的转录调控网络为研究乳腺癌发生发展机制提供了新的方法。 孔薇 李海燕 牟晓阳 杨旸关键词:乳腺癌 基因表达数据 基于非负矩阵分解的大脑不同区域基因表达数据分析 被引量:1 2012年 基因之间存在多种多样的表达调控活动,一般认为这些调控关系隐含在基因表达谱中。针对阿尔茨海默症(AD)起病隐匿、诊断难、发病机理复杂以及基因信号传导通路和调控关系难以重建等特征,利用非平滑非负矩阵分解(nsNMF)方法提取AD致病基因,聚类过程中利用共表型相关性系数(CCC)选取聚类数k的值,得到最优的聚类数目。针对基因表达数据噪声高、信息变量隐藏难分析的困难,考虑AD的发生发展与许多大脑功能区域密切相关的特性,提出将nsNMF分别应用于AD患者的大脑海马区、内嗅区皮质、颞中回及视觉皮层区的基因表达数据中,共提取3 800个显著基因,其中包括确定与AD致病机理有关联的10个致病基因,并进行了生物学分析,得到了AD相关的细胞凋亡、代谢及炎症反应等生物过程,显示nsNMF方法及大脑多区域数据集的联合分析能更全面地探寻AD信号传导关系及基因调控方式。 孔薇 陶伟杰 牟晓阳关键词:非负矩阵分解 阿尔茨海默病 基于网络成分分析的阿尔茨海默症靶基因动态表达研究 被引量:3 2013年 解析转录因子与靶基因之间相互调节的关系并构建转录调控网络,对研究阿尔茨海默症(AD)的致病机理、早期诊断及制药等具有重要意义。网络成分分析(NCA)是一种能够动态预测转录因子活性并表现其影响关系的方法。本研究利用转录因子对靶基因的调控作用,及基因在AD不同病程中表达的先验知识和生物数据,通过预处理AD基因表达数据,选择出10个转录因子和85个靶基因进行网络成分分析,并利用162条调控关系构建AD基因调控网络,形成和展示了转录因子对靶基因的动态调控关系和作用。通过动态预测转录因子活性及构建网络图,发现转录因子在AD疾病的不同程度的活性有明显变化趋势,其调控的靶基因变化符合AD的病理特征。如靶基因NONO在转录因子ANAPC5的调控下,表达值由3 126上升至4 508,而靶基因YWHAZ表达值由6 000下降到接近于0。该研究为AD致病机理探寻、早期诊断和相应的分子生物学实验,提供了新的思路和依据。 孔薇 崔地博 牟晓阳关键词:阿尔茨海默症 转录因子 基于矩阵分解技术的显著基因提取及基因表达数据分析 2014年 基因之间存在多种多样的表达调控活动,一般认为这些调控关系隐含在基因表达谱中。因此,可以根据基因表达数据对基因调控状态进行建模,以挖掘具有生物学意义的信息及隐含在其中的基因调控关系。本文分别利用独立成分分析(ICA)和非负矩阵分解(NMF)这两种无监督矩阵分解技术对阿尔茨海默病(AD)基因表达数据进行显著基因提取及基因调控网络的构建,通过生物学分析,探讨了两种不同矩阵分解技术在挖掘潜在致病基因上的作用,通过结合两种方法所提取的显著基因的生物学分析,体现了炎症反应在AD致病机制中的重要作用,为AD早期诊断、致病机制研究及基因生物标志物的探寻提供了有益的方法。 孔薇 王娟 牟晓阳关键词:矩阵分解 非负矩阵分解 阿尔茨海默病 基于炎症反应的阿尔茨海默症基因通路研究 被引量:5 2014年 目的融合基因表达数据和蛋白质交互作用数据(PPI),同时考虑到炎症反应是阿尔茨海默症(AD)核心病理机制之一,构建基于炎症因子核因子-κB(NF-κB)的AD相关信号传导通路。方法首先,使用线性回归模型进行显著基因提取;然后,使用整数线性规划方法(ILP)融合基因表达数据和PPI数据,构建信号传导通路。结果得到以NF-κB为起点的预测通路,通路中包含6个已确定的AD致病基因,并探寻出与AD密切相关的T/B细胞受体信号通路,发现多个与炎症相关的基因。结论证明炎症反应是AD产生和发展的重要因素之一。 孔薇 张敬茂 牟晓阳 杨旸关键词:阿尔茨海默症 基因表达数据 信号传导通路 炎症反应 基于ICASSO的乳腺癌基因表达数据可靠特征提取 2013年 运用独立成分分析(ICA)方法对乳腺癌基因表达谱数据进行特征提取,并采用聚类及可视化的可靠性评估方法(ICASSO)对所提取的独立成分(IC)进行评估和综合可得到与疾病更加密切相关的显著基因。结果显示,通过与乳腺癌发病的相关性分析,选取显著性高的IC分析发现,其100个特征基因当中,经分子生物学实验验证与乳腺癌发病密切相关的基因有35个,在此基础上通过从基因调控网络的角度分析这些特征基因所参与的生物过程,进一步证实了部分生物过程也与乳腺癌发病密切相关。 孔薇 黄晨曦 牟晓阳关键词:乳腺癌 基于改进稀疏非负矩阵分解方法的乳腺癌微阵列表达数据分析 被引量:6 2013年 目的利用改进稀疏非负矩阵分解技术对乳腺癌基因表达谱数据进行双向聚类,挖掘与乳腺癌发病密切相关的基因及其生物过程。方法用小波对22 283个基因的人乳腺癌基因表达数据进行去噪,然后通过T统计初步筛选出5 067个基因作为改进稀疏非负矩阵的输入矩阵,进行双向聚类进一步筛选出81个与乳腺癌密切相关的显著基因,最后通过cytoscape对81个与乳腺癌密切相关的显著基因构建生物过程结构图。结果筛选出与乳腺癌相关的基因、可能相关的基因以及这些基因参与的生物过程之间的关系。结论改进稀疏非负矩阵分解与现存的其他非负矩阵分解算法相比具有聚类效果好、稳定性强且迭代次数少的优点,适合于乳腺癌差异表达基因的提取。 孔薇 王娟 牟晓阳关键词:乳腺癌 非负矩阵分解 基于集成分量的基因微阵列数据分类方法的研究 被引量:1 2012年 构造高精度分类模型是对基因表达谱数据分析的主要研究方向之一,但提取不同特征空间产生的分类效果有很大差异,而集成分类系统在一定程度上提高了分类结果的可靠性和稳定性。构建基于PCA和NMF集成分量系统,并基于分析混合矩阵A的hinton图生物学意义建立集成独立分量选择系统,成功运用到基因表达谱分析,实验结果表明,集成分量分类系统优于单个分类器。 宋红胜 孔薇关键词:微阵列数据 NMF ICA