李村合 作品数:60 被引量:217 H指数:8 供职机构: 中国石油大学(华东) 更多>> 发文基金: 山东省自然科学基金 中国石油大学(华东)研究生创新基金 山东省优秀中青年科学家科研奖励基金 更多>> 相关领域: 自动化与计算机技术 文化科学 理学 石油与天然气工程 更多>>
基于标记相关性的多示例多标记算法 2018年 多示例多标记学习(Multi-Instance Multi-Label,MIML)是一种新的机器学习框架,基于该框架上的样本由多个示例组成并且与多个类别相关联,该框架因其对多义性对象具有出色的表达能力,已成为机器学习界研究的热点.解决MIML分类问题的最直接的思路是采用退化策略,通过向多示例学习或多标记学习的退化,将MIML框架下的分类问题简化为一系列的二类分类问题进行求解.但是在退化过程中会丢失标记之间的关联信息,降低分类的准确率.针对此问题,本文提出了MIMLSVM-LOC算法,该算法将改进的MIMLSVM算法与一种局部标记相关性的方法ML-LOC相结合,在训练过程中结合标记之间的关联信息进行分类.算法首先对MIMLSVM算法中的K-medoids聚类算法进行改进,采用的混合Hausdorff距离,将每一个示例包转化为一个示例,将MIML问题进行了退化.然后采用单示例多标记的算法ML-LOC算法继续以后的分类工作.在实验中,通过与其他多示例多标记算法对比,得出本文提出的算法取得了比其他分类算法更优的分类效果. 李村合 田程程 姜宇关键词:支持向量机 改进的多标签深度森林算法研究 2023年 多标签深度森林(Multi-Label Deep Forest,MLDF)是一种基于深度森林的深度集成学习模型。为了限制模型的复杂度以及用户可以根据需求优化评价指标,多标签深度森林使用了两种算法:度量感知特征重用与度量感知层增长。前者重用前一层较好的特征,后者用于限制模型增长,然而度量感知特征重用算法使用当前层的输出取算术平均值来计算置信度,忽略了各个森林的精度差异造成的影响。因此,提出一种改进的度量感知特征重用算法,为每个森林在每个标签上赋予权重来计算置信度。实验结果表明,改进的算法在低维多标签数据集上有一定的提升。 李村合 李帅关键词:置信度 网络信息挖掘技术及其应用研究 被引量:20 2002年 网络信息挖掘是网络信息处理领域中的一项新技术 ,是指在大量训练样本的基础上 ,得到数据对象间的内在特性 ,并以此为依据在网络资源中进行有目的的信息提取。本文介绍了网络信息挖掘的含义 ,研究了网络信息挖掘的步骤、类型及其关键技术 。 李村合关键词:网络资源 网络信息挖掘 知识发现 信息检索 查全率 查准率 基于链接结构分析的Web信息检索方法研究 被引量:8 2007年 随着信息技术的发展,特别是互联网技术的不断普及,网上信息数量成指数级增长。如何准确有效地从海量信息中检索出所需的信息,成为一个重要而迫切的研究课题。文中针对基于链接结构分析的Web信息检索方法进行了分析和研究,提出了一种改进的超链接主题查找算法——SAHITS,经过实验验证,改进后的算法更符合人们的一般期望,能有效地提高信息检索系统的查准率。 宋玲玲 李村合关键词:WEB信息检索 一种通用的文件加,解密程序 1996年 一、功能简介 信息传输和存储中的一个重要问题就是信息的隐密性保护。常用的方法是对文件进行加密,以防他人擅自查看;必要时还应有解密措施。本文针对磁盘文件的加密与解密提出了一种通用方法,可以将任何类型的磁盘文件转换成密文文件,以使他人无法直接读取其真实内容;而用户自己则可在需要时将已加密的密文文件还原成明文文件。 李村合关键词:文件加密程序 应用程序 全文增补中 给编辑软件增加定时自动存盘功能 1994年 本文介绍了用直接访问键盘缓冲区和编写内存驻留程序的方法给WPS、Word-Star、Turbo系列等具有编辑功能的软件增加定时自动存盘功能,并给出了实现该功能的Turbo Pascal源程序。 李村合关键词:自动存盘 应用程序 Java调用Oracle存储过程的方法研究 被引量:1 2005年 存储过程是指保存在数据库并在数据库端执行的程序.存储过程在概念上类似于程序中的函数.它们获取输入参数,以黑盒模式运行并返回相应信息.与函数不同的是,存储过程由数据库引擎执行,而不是在程序中执行.也就是说,将信息输入到存储过程或从中输出信息都必须通过与数据库交互的技术来完成.使用存储过程,把SQL语句放到Oracle服务器端来执行,具有性能好、代码独立、并发性强、安全性高等优点.在Java程序中访问数据库,一般采用JDBC技术,JDBC是一项在Java中以面向对象的方法来连接数据库的技术,提供了多样化的数据库连接方式. 李村合 张培颖关键词:JAVA程序 JDBC技术 数据库引擎 并发性 两种适用于中文信息搜集的URL散列函数的研究 被引量:2 2006年 为了适应Internet信息量的快速增长,搜索引擎采用分布式技术搜集信息。采用分布式搜集技术的具体应用中主要存在两个关键问题:URL匹配和系统负载平衡。针对现有的几种分布式信息搜集系统的设计中存在的一些不足,提出了利用URL分级散列进行定位和匹配的方法。根据中文网络信息的特点,分析了几个对字符串散列较好的函数,设计了两种URL散列函数,应用于分布式中文信息搜集系统中。实验表明,系统在减少URL匹配的资源消耗和提高系统负载的均衡性方面有很好的效果。 李村合 何淑庆 张培颖关键词:散列函数 搜索引擎 负载平衡 智能搜索引擎中个性化信息检索技术研究 被引量:4 2008年 信息检索的一个难点是构造一个可以精确表达用户信息需求的检索式。个性化信息检索从某种程度上促进了这个问题的解决,它把用户区别对待,认识到了用户之间的不同之处,它为不同的用户提供不同的服务,以满足不同的需求。从智能搜索引擎中的个性化信息检索服务的角度出发,对其中用户建模的关键技术进行了研究,使用向量空间模型来表示网页和用户兴趣模型,并在此基础上,根据用户浏览网页的日志信息,通过隐性反馈技术,动态地调整用户模型,使用户模型的质量更高、描述用户的兴趣偏好更准确。经过模拟实验验证,该个性化检索算法能够有效地提高检索的查准率,并且具有良好的适应性。 张培颖 李村合关键词:个性化 信息检索 用户兴趣模型 向量空间模型 用程序方法汉化西文软件中的提示信息 1995年 本文介绍了一种对西文软件中的提示信息进行汉化的通用程序。该程序具有简单可靠、效率高等特点,利用该程序可以给汉化工作带来极大的方便。 李村合关键词:西文软件 提示信息 汉化