吴红梅
- 作品数:6 被引量:3H指数:1
- 供职机构:南京航空航天大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于词性加权和单词相似性的蛋白质交互识别
- 2015年
- 与现有绝大多数以单个句子为依据的蛋白质自动识别方式不同,文中基于大规模语料库提出了引入句法和单词相似性这两个因素的蛋白质交互自动识别方法。首先,采用基于特征的方法对蛋白质对签名档进行分类。然后,使用分词工具对蛋白质对签名档进行词性标注,将不同词性的特征词语进行分组,并对每种词性进行加权。最后,基于大规模语料库的方法计算得到单词相似性,根据单词在正、负类中频率的差别调整单词相似性矩阵。实验结果表明,引入词性加权和单词相似性两个因素后,最终的分类结果较基准模型的识别精度有了明显的提升。
- 吴红梅牛耘
- 关键词:大规模语料库
- 基于特征加权的蛋白质交互识别被引量:3
- 2016年
- 在以单词为特征的模型中,如果特征单词在不同类别中的使用情况存在明显差异,那么它对分类有着很重要的影响。因此文中基于大规模语料库,研究不同的特征加权方法对PPI识别的影响。首先,通过搜索医学文献数据库建立蛋白质对的签名档,以单词作为描述蛋白质对关系的特征,构建向量空间模型;然后,选择不同的加权方法描述单词重要性;最后,以K近邻和SVM分类方法构建分类器判断蛋白质对是否存在交互关系。实验结果表明,根据特征向量单词的重要性进行加权,PPI识别精确度、召回率和准确率有了明显的提高。
- 吴红梅牛耘
- 关键词:大规模语料特征加权K近邻支持向量机
- 基于上下文语义相似性约束的蛋白质交互关系识别
- 蛋白质交互(Protein-Protein Interaction,PPI)是生物医学领域一项重要的研究内容,目前由生物医学进行的PPI实验结果主要以文献的形式存储。PPI信息对生物、医药研究有着重要的意义,因此生物医学...
- 吴红梅
- 关键词:生物医学文献上下文语义相似性信息识别
- 基于文本关系相似性的蛋白质交互关系识别方法
- 本发明公开了一种基于文本关系相似性的蛋白质交互关系识别方法,包括如下步骤:步骤1:获取文本集中的蛋白质对关键词的句子,对所有句子进行集合得到签名档S;每个蛋白质对为(p1,p2),每个目标蛋白质对都会有签名档与其相对应;...
- 牛耘王宇伟吴红梅魏欧
- 基于Minimum Cuts的蛋白质交互识别被引量:1
- 2017年
- 蛋白质交互信息对生物、医药研究有着重要意义,是生物医学领域一项重要的研究内容。对基于大规模语料库的蛋白质交互识别,直接利用已有的PPI数据库,能显著降低人工标注的代价。为此,在大规模语料库的基础上,提出了基于Minimum Cuts的蛋白质交互识别方法。在关系相似性框架下,Minimum Cuts分类器不仅采用SVM算法对单个蛋白质对进行初步分类预测,还利用蛋白质对之间的相似性约束判断结果,使分类结果更加准确。实验结果表明,利用Minimum Cuts分类器进行PPI的识别结果优于SVM分类器的识别结果。当训练数据为20%时,Minimum Cuts分类器的识别结果优于训练数据为80%时的SVM分类器的识别结果。
- 张景吴红梅牛耘
- 关键词:CUTS支持向量机
- 基于文本关系相似性的蛋白质交互关系识别方法
- 本发明公开了一种基于文本关系相似性的蛋白质交互关系识别方法,包括如下步骤:步骤1:获取文本集中的蛋白质对关键词的句子,对所有句子进行集合得到签名档S;每个蛋白质对为(p1,p2),每个目标蛋白质对都会有签名档与其相对应;...
- 牛耘王宇伟吴红梅魏欧
- 文献传递