刘胜久 作品数:35 被引量:90 H指数:7 供职机构: 西南交通大学 更多>> 发文基金: 国家自然科学基金 长江学者和创新团队发展计划 中央高校基本科研业务费专项资金 更多>> 相关领域: 自动化与计算机技术 理学 更多>>
元搜索引擎排序方法建模与算法研究 被引量:4 2012年 元搜索引擎的核心技术是排序算法。在研究元搜索引擎排序算法的基础上,通过合理简化等一系列措施建立数学模型,抽象出元搜索引擎排序算法的基本框架。随后结合各成员搜索引擎的市场份额及各成员搜索引擎的搜索结果,给出了一种新的元搜素引擎排序算法。该算法简单且易于实现。 刘胜久 李天瑞 贾真 尹红风关键词:搜索引擎 元搜索引擎 排序 基于Spark Streaming的流式并行文本校对 被引量:5 2020年 互联网的高速发展催生了海量网络文本,这对传统的串行文本校对算法提出了新的性能挑战。尽管近年来文本自动校对任务受到了较多关注,但相关研究工作多集中于串行算法,鲜有涉及校对的并行化。文中首先对串行校对算法进行泛化,给出一种串行校对的通用框架,然后针对串行校对算法处理大规模文本存在的耗时长的不足,提出3种通用的文本校对并行化方法:1)基于多线程的线程并行校对,它基于线程池的方式实现段落和校对功能的同时并行;2)基于Spark MapReduce的批处理并行校对,它通过RDD并行计算的方式实现段落的并行校对;3)基于Spark Streaming流式计算框架的流式并行校对,它通过将文本流的实时计算转为一系列小规模的基于时间分片的批处理作业,有效避免了固定开销,显著缩短了校对时延。由于流式计算兼有低时延和高吞吐的优势,文中最后选用流式校对来构建并行校对系统。性能对比实验表明,线程并行适合校对小规模文本,批处理并行适合大规模文本的离线校对,流式并行校对有效减少了约110s的固定时延,相比批处理校对,采用Streaming计算框架的流式校对取得了极大的性能提升。 杨宗霖 李天瑞 刘胜久 殷成凤 贾真 珠杰关键词:并行计算 多线程 SPARK 带权超网络的多重分形研究 被引量:1 2020年 超网络是较通常意义上的复杂网络更为复杂的网络,超网络维数是度量超网络的一种可行的方法.针对带权超网络中节点权重及超边权重可以分别为正实数、负实数、纯虚数及复数等多种不同的类型,首先给出了各种不同类型带权超网络的多重分形维数;然后讨论了带权超网络的多重分形特性;研究表明,在不同类型的带权超网络中,除节点权重及超边权重均为正实数及负实数的两种情形之外,其他类型的带权超网络均具有多重分形特性,且可以分为7个不同的类别,均分布于整个复平面;最后给出了所有这些带权超网络多重分形维数的解析表达式,并分析了这些带权超网络多重分形维数的若干重要性质. 刘胜久 李天瑞 李天瑞 谢鹏关键词:超图 超网络 分形维数 一种超网络的构建方法 本发明公开了一种基于一个超图邻接矩阵的Tracy-Singh积运算的超网络构建方法,其主要步骤包括确定生成超网络、计算生成超网络邻接矩阵、计算生成超网络节点度分布多项式、计算生成超网络节点超度分布多项式、计算生成超网络超... 李天瑞 刘胜久 杨燕 王红军文献传递 基于矩阵运算的复杂网络构建方法 被引量:10 2016年 本文从邻接矩阵的视角分析复杂网络,研究了基于矩阵Kronecker积运算与Kronecker和运算的复杂网络构建方法.将Kronecker积运算迭代地应用于一个简单初始网络的邻接矩阵,得到了一个Kronecker积图,也是一个分形维数不超过2的自相似网络.当初始网络是连通非二分图时,则得到的Kronecker积图同时具有小世界特性,其直径不超过初始网络直径的两倍.其次,将Kronecker和运算顺次应用于多个简单初始网络的邻接矩阵,得到了一个Kronecker和图,也是一个度分布呈正态分布的随机网络.最后,给出了基于矩阵运算的复杂网络构建方法的若干性质. 刘胜久 李天瑞 洪西进 王红军 珠杰关键词:复杂网络 矩阵运算 自相似网络 分形维数 随机网络 一种复杂网络构建方法 本发明涉及电数字数据处理领域,特别适用于特定功能的数据处理方法,具体涉及一种基于邻接矩阵Kronecker和的复杂网络构建方法。本发明提供了一种基于邻接矩阵Kronecker和的复杂网络构建方法,基于一个简单的生成网络,... 李天瑞 刘胜久 珠杰 王红军文献传递 基于搜索引擎的相似度研究与应用 被引量:3 2014年 搜索引擎是现代社会不可或缺的最重要互联网应用之一,对其关注的重点也从商业领域逐步转移到科研领域。针对现今相似度计算方法不能全面反映对象间的关联性的局限,提出了一种基于搜索引擎的相似度计算方法。在搜索引擎结果数目的基础上,借鉴集合论的思想,通过引入搜索引擎市场份额及一系列的简化等数学方法,融合多个搜索引擎结果,最终得到相似度。实验结果证实了所提出的相似度计算方法的可行性与有效性。 刘胜久 李天瑞 贾真 景运革关键词:搜索引擎 相似度 集合论 市场份额 基于条件随机场的藏文人名识别技术研究 被引量:12 2016年 文本挖掘中命名实体识别是一项重要的研究内容,利用统计学原理进行命名实体识别具有较高的识别率.利用条件随机场(conditional random fields,CRF)方法,研究藏文人名识别技术,重点探讨藏文人名的内部结构特征、上下文特征、特征选择和数据预处理等内容,并通过实验分析了不同特征的有效性.首先给出了基于字(音节)和字位信息的人名识别方法;其次研究了触发词、虚词、人名词典和指人名词后缀为特征的不同特征组合与优化,并细化了不同虚词对人名识别的作用;最后,通过不同组合的实验测试,结果表明:1)触发词和作格助词特征在藏文人名识别上能够起到积极的作用;2)不同特征窗口大小对人名识别有一定影响;3)利用CRF识别藏文人名F1值能够达到80%左右,但由于藏文两字人名的高歧义性,目前还达不到与其他语言相近的识别效果. 珠杰 李天瑞 刘胜久基于矩阵运算的超网络构建方法研究及特性分析 被引量:1 2018年 基于邻接矩阵Khatri-Rao积运算及Khatri-Rao和运算,研究了构建超网络的方法,并通过边际节点度及联合节点度来研究超网络的内在机理。将Khatri-Rao积运算迭代地应用于一个初始图序列组成超网络的邻接矩阵,得到一个分形维数不超过3的自相似超网络。若所有初始图均是连通非二分图,则得到的超网络同时具有小世界特性,其直径不超过所有初始图直径和的两倍。此外,将Khatri-Rao和运算顺次应用于多个初始图序列组成超网络的邻接矩阵,得到一个边际节点度呈一维高斯分布而联合节点度呈高维高斯分布的随机超网络。最后,给出了基于矩阵运算的超网络构建方法的若干性质。 刘胜久 李天瑞 洪西进 王红军 王红军关键词:矩阵运算 复杂网络 超网络 分形维数 特性分析 一种基于多通道融合与重排序的中文文本自动校对方法 本发明公开了一种基于多通道融合与重排序的中文文本自动校对方法。该方法中的神经机器翻译模型选择卷积编解码网络,通过三个预测通道结合字级别和子词级别的校对模型,其中各通道均启用集成解码机制并输出N个最佳候选,然后应用重排序组... 李天瑞 杨宗霖 刘胜久 殷成凤 贾真文献传递