聂洪玉 作品数:17 被引量:53 H指数:4 供职机构: 西南交通大学信息科学与技术学院 更多>> 发文基金: 中央高校基本科研业务费专项资金 教育部科学技术研究重点项目 国家级大学生创新创业训练计划 更多>> 相关领域: 自动化与计算机技术 更多>>
基于U形有向无环支持向量机的多类文本分类研究 2013年 针对原始的有向无环支持向量机(Directed Acyclic Graph Support Vector Machine,DAGSVM)多类文本分类算法结构图中存在误差累积以及路径冗余的问题,提出一种改进的有向无环图支持向量机多类文本分类算法。将易于分离的那些类两两组成两类分类器放置在结构图的上层,有效克服了误差累积问题,通过将原始的分类结构图改造为U形图以及引入集合运算进行类别判定,有效剪除冗余路径并降低时间复杂度。实例表明,该算法能有效提高类别判定的准确率并降低时间复杂度。 翟东海 杜佳 聂洪玉 崔静静基于互信息的热点词发现和突发性话题检测研究 被引量:2 2013年 针对舆情监测中现存的热点词提取方法精度不高、速度不快的问题,文章采用互信息作为热点词突发性的度量手段,并使用类间离散度作为调节因子来构建热点词的突发性度量公式。在此基础上,构造了改进后的动态突发性向量空间模型,并用于网络中突发性热点话题的发现与追踪。实例验证结果表明,文章提出的改进方法能够获得很好的准确度P、召回率R和F度量。 翟东海 王佳君 聂洪玉 崔静静关键词:互信息 基于改进的χ~2检验的热点词突发性度量研究 被引量:1 2013年 采用原始χ2检验公式进行突发性度量时存在低频词偏袒问题,论文提出了结合TF的改进的χ2检验方法能有效克服该问题。该方法将词频累加和作为文档统计篇数的影响因子β引入原始χ2检验公式从而解决了低频词偏袒问题,提高了度量热点词突发性的精确度。动态突发性热点词库依据改进后的χ2检验公式得到的突发性度量值来建立,并将该词库运用在动态突发性向量空间模型中来发现与追踪网络突发性热点话题。实例验证表明,利用该文的方法进行话题发现与追踪,可以获得有更高的准确率、召回率以及F度量。 翟东海 聂洪玉 崔静静 于磊 杜佳 王佳君关键词:词频 光滑拟合模型的IIPBDR图像修复算法 被引量:2 2015年 目的原始的破损区域分块划分的图像修复(IIPBDR)算法在修复连接两断裂边界线时,采用的是直线路径,这使得IIPBDR算法不适合修复含有较大曲率边界线的破损图像。针对IIPBDR算法所存在的问题,本研究希望找到一种方法能够求得任意两匹配好断裂边界线之间的光滑曲线路径,并用此曲线路径来代替IIPBDR算法中的直线路径,以对IIPBDR算法进行改进。方法 1)通过模仿人类的视觉连通性原理提出了光滑拟合模型;2)采用最小二乘法求取光滑拟合模型的各个参数,进而求得两断裂边界线之间的光滑曲线路径;3)用该光滑曲线路径来代替IIPBDR算法中的直线路径以修复连接两断裂边界线。结果基于以上研究,文中提出了"光滑拟合模型的IIPBDR图像修复算法",并对破损区域较大、结构信息较复杂的破损图像进行了修复实验。和BSCB(Bertalmio,Sapiro,Caselles,Ballester)、Criminisi、IIPBDR算法相比,本文算法所修复图像的PSNR值平均提高2.40 d B,且具有较好的视觉连通性效果、其边界线过渡更加自然。结论本文改进算法在一定程度上克服了IIPBDR算法不适合修复含有较大曲率边界线的破损图像的缺点。 鱼江 翟东海 聂洪玉 李同亮关键词:图像修复 最小二乘法 基于语义相似度的话题关联检测方法 被引量:6 2015年 为有效识别任意两篇报道的相似性,提出了一种基于语义相似度的话题关联检测算法.该算法首先通过计算特征词之间的相对熵作为两篇报道中特征词之间的语义相似度;其次,通过计算平均语义相似度获得特征词和报道之间的关联度;最后,结合特征词在语料库中的TF-IF(term frequency-inverse document frequency)权重计算两篇报道之间的关联度,实现报道之间的关联度检测.本文提出的方法与现有的向量空间模型方法和仅依赖于平均点互信息的方法进行了比较,并通过TDT4中文语料进行测评,结果表明,基于语义相似度的关联检测方法能够更好地利用文本的语境信息,提高了现有检测系统的性能,其最小DET(detection error tradeoff)代价降低了3%. 翟东海 崔静静 聂洪玉 杜佳关键词:语义相似度 相对熵 基于自适应簇中心选择的文本聚类算法研究 被引量:1 2013年 为解决传统的K-means算法需要人工确定K值和随机选取初始簇中心容易陷入局部最优的问题,提出自适应簇中心选择算法。首先将任意选取的一篇文档和与其距离最远的文档作为初始簇中心聚类得到2个大类并重新计算簇中心,然后,找出与新的簇中心距离大于设定阈值的文档并依据文档距离判断是否需要增加新的类别,迭代上述过程确定聚类簇中心及类别数。实例验证结果表明,提出的算法与改进的K-means算法相比,在聚类结果的质量和算法收敛的速度上都有明显的改善。 翟东海 聂洪玉 崔静静 杜佳关键词:海量数据挖掘 K-MEANS算法 基于断裂结构线匹配模型的大破损区域图像修复算法 被引量:4 2016年 针对现阶段含有复杂结构信息的大破损区域图像修复算法中存在的断裂结构线连接错误、连接不平滑的问题,提出一种基于断裂结构线匹配模型的大破损区域图像修复算法。首先,深入分析了影响断裂结构线匹配度计算的因子,并根据这些影响因子的重要程度赋予不同权重值,在此基础上构造了一种断裂结构线匹配模型以得到相应的断裂结构线匹配对;然后,在这些断裂结构线匹配对的基础上拟合出光滑结构线,并将大的破损区域划分为了不同的子区域;最后,使用块匹配算法对破损子区域进行像素填充。在进行的6组对比实验中,所提算法在处理含有丰富结构信息的大破损区域边缘时,能够准确地对断裂结构线进行配对并且能在配对结果的指导下平滑连接断裂结构线,修复后的图像视觉效果明显比改进后的Criminisi算法、Hays算法以及IIPBDR算法得到的效果好。 聂洪玉 翟东海 鱼江 王猛关键词:匹配度 基于多尺度输入图像渗透模型的桥梁裂缝检测 被引量:15 2017年 针对现有铁路混凝土桥梁表面裂缝检测方法精确度不高的问题,引入多尺度输入图像渗透模型,提出一种新的桥梁裂缝检测方法。使用加权分段函数进行图像对比度增强,通过最佳阈值分割滤除大部分非裂缝区域,采用不同的高斯核得到不同尺度的输入图像。在渗透模型的基础上,利用多尺度输入图像生成高精度且仅包含裂缝信息的二值裂缝地图,并利用梯度信息提取裂缝的面积、最大宽度及长度等信息。实例验证结果表明,该方法可有效提高检测精确度和稳定性。 张晶晶 聂洪玉 喻强关键词:对比度增强 基于破损区域分类的自适应扩散模型 被引量:2 2016年 为了提高数字图像的修复精度,加快修复速度,提出了一种自适应扩散模型。该模型利用结构张量的最大特征值将破损图像区分为平坦区域、结构信息不明显的区域以及结构信息明显的区域,使模型在不同区域进行相应的扩散;利用结构张量的两个特征值构造了速度函数,使模型在不同区域的扩散速度也不同,从而加快扩散速度并保持图像的结构信息。实验结果表明,该模型不仅可以加快修复速度,而且可以很好地抑制噪声,并且保持图像的结构特征。 段维夏 聂洪玉 王猛关键词:结构张量 结构特征 基于条件随机场的敏感话题检测模型研究 被引量:7 2014年 敏感话题通常包含态度倾向性,且具有一定的先验知识,如何有效利用这些先验知识来判断网络文本的敏感性是敏感话题检测的研究难点和热点。在充分利用条件随机场强大知识拟合能力的基础上,提出一种基于条件随机场的敏感话题检测模型。抽取特征词项,并结合敏感词汇库,将待检测文档和敏感话题类别分别表示为条件随机场中的观察序列和状态序列,再利用敏感话题类别中的先验知识来构造特征函数,从而使观察序列和状态序列建立联系。将待测文档中的特征项根据概率标注为敏感话题类别中的词项,在此过程中采用Viterbi算法对观察序列的可信度进行估计,并依据估计所得的概率值对待测文档中的特征项进行敏感性标注。实例验证结果表明,该算法能够得到较好的准确率、召回率和F度量值。 翟东海 崔静静 聂洪玉 于磊 杜佳关键词:条件随机场 特征函数 VITERBI算法