胡刚 作品数:14 被引量:9 H指数:2 供职机构: 南开大学数学科学学院 更多>> 发文基金: 国家自然科学基金 天津市自然科学基金 天津市应用基础与前沿技术研究计划 更多>> 相关领域: 理学 生物学 一般工业技术 医药卫生 更多>>
用SVM和FFT对膜蛋白功能分类 2009年 膜蛋白在细胞生命活动中扮演着重要的角色。目前,有很多方法用来预测和分类膜转运蛋白。然而,预测膜蛋白功能的工作并不多。为了解决这个问题,基于蛋白质序列信息结合快速傅里叶变换利用支持向量机的方法预测来自TCDB数据库中的channels/pores,electrochemical potential-driven transporters和primary active transporters三类膜转运蛋白共1817条蛋白质的功能。模型使用20种氨基酸的分布,残基的疏水性、平均极性和溶剂化自由能为原始的特征数据,利用快速傅里叶变换将其转化为频域上的信息作为机器学习的特征输入。通过五倍交叉检验预测准确率达到了72.1%,而先前的文献报道的准确率为68.1%。论文的研究证明该方法可以有效地对channels/pores,electrochemical potential-driven transporters和primary active transporters三种不同功能的膜转运蛋白进行功能分类。 高建召 王奎 胡刚 张华关键词:支持向量机 快速傅里叶变换 疏水性 多重序列突变网络系统分析与应用 2006年 为分析多重生物序列的突变结构,首先是要作它们的多重比对,在多重比对基础上可作出各序列的系统树与最小距离树,在最小距离树中如果把它们的弧用突变模结构来表示,那么我们称由此所产生的数学模型为多重序列突变网络系统(以下简称突变网络),突变网络分析的主要问题是如何确定各种不同类型突变的相互关系问题,一种最简单关系是二个突变的突变区域互不重叠,我们称之为正交化。因此突变网络分析的一个重要目的是对突变网络作正交化的简化,本文给出了突变网络正交化的基本定理,并以SARS病毒基因组为例,说明它们的突变网络系统模型与正交化运算,并由此得到SARS病毒从早期传播到爆发的基因突变过程的确定。 沈世镒 胡刚 王奎 董骝焕统计深度的几何推广 2010年 改进统计深度的定义,并将点的深度概念推广到直线与平面的深度,由此得到深度计算的基本定理和深度的一系列性质.最后讨论应用展望. 张华 胡刚 沈世镒结合最新基因和干细胞技术的组织工程和人工器官研究 孔德领 欧来良 张钧 王燕铭 王连永 关勇 胡刚 俞耀庭 车永哲 程兆康 陈伯利 李东霞 该项目将国内外在基因和干细胞领域的最新技术与工程化活性材料有机结合,在组织工程化小口径血管、组织工程化尿道、心肌梗死的治疗、非病毒基因载体领域进行了大量研究,取得了丰富的研究数据,为今后干细胞和基因技术迈向临床做出了科学...关键词:关键词:人工器官 非病毒基因载体 血管内皮生长因子 蛋白质深度分析以及基因的进化模型 本论文由两个部分组成。第一部分讨论深度问题,第二部分讨论进化问题。
蛋白质残基的深度问题一直是蛋白质结构研究领域的一个重要问题。目前在生物学中已经有一些方法定义。我们在这篇论文中利用统计深度函数,用几何学的方法... 胡刚文献传递 基于序列和局部信息熵的蛋白质折叠速率预测模型 被引量:2 2010年 正确预测蛋白质折叠速率对理解蛋白质的折叠机制非常重要。本文从AAindex数据库中的531种残基物理化学性质、序列长度信息和局部结构信息熵中筛选特征,从而提出了一个基于蛋白质序列信息的线性回归模型。针对三种折叠机制two-state,multi-state和mixed-state,用Jackknife验证模型,预测的折叠速率和实验验证的折叠速率相关系数分别为0.790,0.829和0.778。本文结果表明四阶局部结构信息熵和折叠速率有很高的负相关性;蛋白质的长度和蛋白质的折叠速率成反比关系;螺旋的含量会加快蛋白质的折叠过程。对two-state蛋白质β折叠的含量会减慢蛋白质的折叠过程;和其他模型相比,我们提出的线性回归模型具有输入参数少,计算简单,平均绝对误差小的优点。 高建召 胡刚 王奎 沈世镒基于SPA的蛋白质编码基因的比对 2008年 给出了二重比对 SPA 算法的一个扩展,把 SPA 算法推广到蛋白质编码基因的比对中.首先利用经典的密码子进化模型,得到了密码子两两的得分矩阵,并用该矩阵对 SPA 算法进行了修改,使其更加合理有效地应用于蛋白质编码基因的比对. 胡刚 沈世镒关键词:蛋白质编码基因 原核生物基因组的CDS与ORF序列的几点分析 2009年 基因组的开放阅读框(ORF)是基因识别与基因组分析的基础,有多种软件包给出了它们的生成算法,但结果与指标并不统一.本文给出了po-MORF的定义与它的生成算法,证明了由基因组所确定的po-MORF集合的存在与唯一性,并由该生成算法可以得到全部po-MORF序列.我们还比较了若干原核生物基因组中所有CDS与po-MORF序列的相互关系,并讨论了关于基因识别中的有关问题. 沈世镒 高建召 胡刚 王奎广义差错长序列的数据库搜索及其快速算法 2006年 所谓广义差错是指同时可能具有符号改变、插入与删除的差错,在数据库搜索中如何对具有广义差错的语句进行搜索是近期计算科学发展的重要问题,尤其是对长序列的搜索问题的研究还很少开展。论文对此问题进行讨论,并给出它的快速算法。 沈世镒 胡刚 夏树涛序列比对(Alignment)的随机分析与快速算法 沈世镒 阮吉寿 吴忠华 胡刚 王奎 该项目对二重序列,给出了用统计判决理论实现了线性计算复杂度的SPA算法,计算速度大大快于国际著名的Smith-Waterman 的动态规划算法。将离散情形推广到一般度量空间的情形,并在蛋白质空间结构与图像处理等问题中开展...关键词: