陈薇 作品数:36 被引量:49 H指数:3 供职机构: 广东工业大学 更多>> 发文基金: 国家自然科学基金 NSFC-广东联合基金 广东省自然科学基金 更多>> 相关领域: 自动化与计算机技术 理学 文化科学 电子电信 更多>>
一种基于跨平台基因表达数据的基因调控网络重建方法 本发明涉及一种基于跨平台基因表达数据的基因调控网络重建方法,根据跨平台基因表达数据的特点,通过获取来自p个测序平台基因表达数据,并进行预处理,然后从每个基因样本中抽取n个基因表达量,并基于偏相关系数的混合型条件独立性测试... 蔡瑞初 林殷娴 郝志峰 温雯 谢峰 许柏炎 陈薇 陈炳丰一种基于贝叶斯非参模型的脑功能区划分方法 本发明公开了一种基于贝叶斯非参模型的脑功能区划分方法,其包括步骤如下:S1:获取rs‑fMRI数据集中n个脑素的相对位置和时间序列;S2:对计算两两脑素之间的相对位置距离矩阵和时间序列距离矩阵;S3:将相对位置距离矩阵和... 蔡瑞初 刘跃群 陈薇 伍运金 郝志峰基于因果自回归流模型的因果结构学习算法 2024年 因果自回归流模型已经在非独立噪声等场景的因果方向推断问题上取得了一定的进展,但在多个结点的场景下仍存在全局结构搜索带来的准确度低和计算时间复杂度高的问题。面向非时序观察数据设计一种两阶段因果结构学习算法。在第一阶段,基于观测数据的条件独立性,对完全无向图通过条件独立性检验得到基本的因果骨架;在第二阶段,基于因果自回归流模型,通过标准化流的方法计算骨架中每条无向边在不同方向上的边缘似然概率,进而通过比较边缘似然概率进行因果方向推断。实验结果表明:该算法在多组不同参数生成的仿真因果结构数据集上均有较好的表现,与现有的主流因果结构学习算法相比,F1值平均提升15%~28%;在真实因果结构数据集实验中,该算法能够较为完整准确地学习到变量间的因果关系,与主流的因果结构学习算法相比,F1值平均提升28%~48%,具有更强的鲁棒性。 卢小金 陈薇 郝志峰 蔡瑞初基于条件独立性检验的非稳态因果发现方法 被引量:1 2024年 非稳态时间序列数据之间的因果关系发现是非常重要但极具挑战的问题。现有的工作主要假设观察数据随着时间或领域发生变化。上述假设使得相关方法需要引入时间或领域作为先验知识,无法应用于分段稳态的非稳态场景。因此,提出了一种基于条件独立性检验的非稳态因果关系发现算法。首先使用变化点检测方法来识别非稳态变化的时间点,然后将上一步的时间点进行区间划分,用基于条件独立性检验的时序因果关系发现算法推断局部稳态因果结构。在仿真和真实世界数据上的实验证明了该方法的有效性。 郝志峰 张维杰 蔡瑞初 蔡瑞初关键词:非稳态 因果网络 基于贝叶斯网络的基因变异间的因果关系发现与验证 被引量:2 2020年 基因变异间的相关性是全基因组关联分析等领域中的难点。当前基因变异间关系的研究主要基于基因在染色体上的相对位置展开,从另一个角度研究发现位于同一信号通路中的基因变异之间具有较强的因果性。基于单核苷酸多态(Single Nucleotide Polymorphisms,SNPs)数据对基因状态进行编码,得到离散型的基因变异状态数据;基于大量的基因变异数据构建基因间的因果贝叶斯网模型;用真实信号通路对基因变异数据上发现的因果贝叶斯网络进行验证。在WTCCC(Wellcome Trust Case Control Consortium)数据集上的实验结果表明,相互调控的基因之间的变异具有较强的因果关系。同时,实验也发现了一批具有较强因果关系的基因变异,可能对相关研究具有一定的启发意义。 蔡瑞初 甄启祺 陈薇 郝志峰关键词:因果关系 基因变异 贝叶斯网 单核苷酸多态性 信号通路 融合先验约束的拓扑霍克斯过程格兰杰因果发现算法 2022年 离散时序数据的格兰杰因果关系发现算法具有重要应用价值。现有方法主要采用霍克斯过程建模,无法适用于非独立同分布数据和带有时间误差的数据。为此,提出了一种融合先验约束的拓扑霍克斯过程格兰杰因果关系发现算法(PTHP)。首先,使用基于约束的方法筛选出一批显著性水平较高的因果边,提升算法对故障发生时间误差的容忍性;随后,将上一步获取的边作为先验约束融合到拓扑霍克斯过程中,解决序列间的非独立同分布问题。模拟数据和真实数据的实验证明了该方法的有效性,并获得了PCIC 2021因果推理大赛第一名。 蔡瑞初 刘跃群 黄正婷 黄晓楷 陈薇 郝志峰关键词:格兰杰因果 面向社交媒体的直接因果网络发现算法 被引量:3 2020年 高维时序因果网络发现是社交媒体因果关系发现的重要问题。然而,现有的时序因果关系发现方法不能发现直接因果以致因果网络推断结果不准确。针对此问题提出了一种直接因果网络发现方法。该方法考虑了时序因果模型的因果延迟、滞后期数量和条件节点集等因素,更准确地发现直接因果关系;另外,采用结合置换检验的因果关系检验方法,解决传递熵阈值难以设定的问题。实验结果表明,该方法在因果网络推断中优于现有方法,有效提升时序上直接因果网络推断的准确率,适用于发现潜在社交媒体因果关系网络。 蔡瑞初 谢泳 陈薇 曾艳 郝志峰 杜文俊关键词:因果关系 社交媒体 基于非时序观察数据的因果关系发现综述 被引量:39 2017年 探索和发现事物间的因果关系是数据科学的一个核心问题,其中蕴含着丰富的科学发现机会和巨大的商业价值.基于非时序观察数据的因果关系发现方法能够从被动观察获得的数据中发现变量之间的因果关系,因而在各领域有广泛应用.这一类方法在过去三十年取得很大进展,已经成为因果关系发现的重要途径.文中从因果关系方向推断、高维数据上的误发现率控制和不完全观察数据上的隐变量检测这三个研究热点出发,对现有的因果关系模型与假设、基于约束的方法、基于因果函数模型的方法和混合型方法这三大类方法,验证与测评涉及的数据集及工具等方面进行了详尽的介绍与分析.基于约束的方法主要包括因果骨架学习和因果方向推断两个阶段:首先基于因果马尔可夫假设,采用条件独立性检验学习变量之间的因果骨架,然后基于奥卡姆剃刀准则利用V-结构确定因果方向,典型的算法有Peter-Clark算法、Inductive Causation等,这类方法的主要不足是存在部分无法判断的因果关系方向,即存在Markov等价类难题.基于因果函数模型的方法则基于数据的因果产生机制假设,在构建变量之间的因果函数模型的基础之上,基于噪声的非高斯性、原因变量与噪声的独立性、原因变量分布与因果函数梯度的独立性等因果假设推断变量之间的因果关系方向,典型的算法有针对线性非高斯无环数据的Linear NonGaussian Acyclic Model算法、针对后非线性数据的Post-NonLinear算法、适用于非线性或离散数据的Additive Noise Model等,这类方法的主要不足是需要较为严格的数据因果机制假设,且Additive Noise Model等方法主要适用于低维数据场景.混合型方法则希望充分发挥基于约束的方法和基于因果函数类方法的优势,分别采用基于约束的方法进行全局结构学习和基于因果函数模型进行局部结构学习和� 蔡瑞初 陈薇 张坤 郝志峰关键词:因果关系 人工智能 面向多元时间序列的群体因果关系发现算法 2023年 从多元时间序列观测数据中学习多个变量之间的因果关系是许多专业领域中的重要基本问题。现有的多元时间序列因果关系发现方法通常从每个个体的观测数据中学习个体因果关系,没有考虑部分个体之间可能存在相同的因果关系,导致样本利用不足。提出一种面向多元时间序列的群体因果关系发现算法。该算法分为2个阶段:第一阶段基于因果关系对个体之间的相似性进行度量,并把多个个体划分成多个群体,且无须指定群体的个数;第二阶段基于变分推断方法充分利用每个群体内的所有个体数据,从而学习群体因果关系。实验结果表明,该算法在多组不同参数生成的仿真数据上均具有较好的表现,与对比算法相比,AUC评分提升了5%~20%。在真实数据集中,该算法能够较好地区分具有不同因果关系的群体,并且能够学习到不同群体之间不同的因果关系,表明算法不仅具有因果关系发现能力,而且还具有多元时间序列聚类能力。 蔡瑞初 伍运金 陈薇 郝志峰关键词:多元时间序列 因果关系 聚类 一种面向无线网络性能指标的因果发现方法及系统 本发明涉及人工智能与因果关系发现的技术领域,提出一种面向无线网络性能指标的因果发现方法及系统,包括以下步骤:采集无线网络的若干个观测变量的性能指标数据,形成无线网络性能指标数据;利用高阶积累量,计算所述无线网络性能指标数... 陈薇 彭琳钧 黄智毅 蔡瑞初 郝志峰 陈炳丰