秦玉华 作品数:29 被引量:83 H指数:5 供职机构: 青岛科技大学信息科学技术学院 更多>> 发文基金: 云南中烟工业有限责任公司科技项目 中国烟草总公司科技项目 国家科技支撑计划 更多>> 相关领域: 自动化与计算机技术 理学 轻工技术与工程 机械工程 更多>>
特征分层结合改进粒子群算法的近红外光谱特征选择方法研究 被引量:10 2019年 在近红外光谱数据定量建模中,数据的高冗余和高噪严重影响了建模的稳健性和精确性,因此提出了一种特征分层结合改进粒子群算法(PSO)的特征光谱选择方法。首先通过互信息度量特征的重要性得分,并按特征的重要性降序排序,有效避免了因采用降维方法得到主成分而引起的丢失重要信息的问题。其次,引入了跳跃度概念,并构造了一种特征分层的方法,重要性程度相似的特征并入同一个特征子集,将降序排列的特征集分割为不同的特征子集,避免了筛选特征过程中因人为设定特征重要性得分阈值而导致的不确定性。最后,采用收敛速度快、控制参数少的粒子群算法作为最优特征子集的优化方法,同时对粒子群算法做了两方面改进:引入混沌模型增加种群的多样性,提高了PSO的全局搜索能力,避免陷入局部最优;将特征数目引入到适应度函数中,在迭代前期通过惩罚因子调节特征数目对适应度函数的影响,提高了算法的适应能力。将分层后的数据以特征子集为单位,依次累加并作为改进粒子群算法的输入,从而选择出高辨别力的特征子集。以烟碱指标为例进行了特征选择过程的描述,实验采用尼高力公司的AntarisⅡ近红外光谱仪进行近红外光谱数据的采集,光谱扫描范围为4 000~10 000 cm^(-1)。首先,利用互信息理论计算全光谱1 557个特征对待测指标定量建模的重要性得分,得分取30次实验的均值。其次,将所有特征按照重要性得分降序排序,计算所有特征的跳跃度,依据跳跃度寻找特征分层的临界点,将特征划分到不同的特征层中,构建了包含8个特征子集的特征集合S={S′_1,S′_2,S′_3,S′_4,S′_5,S′_6,S′_7,S′_8}。然后,依次将特征子集S′_1,{S′_1,S′_2},{S′_1,S′_2,S′_3},…,{S′_1,S′_2,S′_3,S′_4,S′_5,S′_6,S′_7,S′_8}作为初始粒子群的候选集,以R/(1+RMSEP)作为特征子集优� 徐宝鼎 秦玉华 杨宁 高锐 苑程程关键词:改进粒子群算法 近红外光谱 一种近红外光谱设备的稳定性判别方法 本发明公开了一种近红外光谱设备的稳定性判别方法,包括标样光谱稳定性模型构建过程以及实测光谱稳定性判别过程,通过构建稳定性模型并计算扫描光谱的稳定性指数,从而可以客观地判别出未知扫描光谱的稳定性,进而根据扫描光谱的稳定性可... 宫会丽 丁香乾 杨宁 于雪涛 秦玉华文献传递 高维特征选择方法在近红外光谱分类中的应用 被引量:18 2013年 针对卷烟近红外光谱高噪和高冗余特点,提出了一种基于随机森林(RF)和主成分分析(PCA)的特征优选方法 RF-PCA,建立了5种不同质量级别卷烟的分类模型,并和其他方法进行了比较。该方法能够有效地对高维数据样本进行分类,用于甄别卷烟品质真伪。特征选择可以过滤与分类不相关的特征,而通过PCA方法可以消除冗余特征的不良影响,并可进一步降低特征维数。实验表明:RF-PCA方法能有效地剔除近红外光谱数据中的噪声特征和冗余特征,提高了分类效率。 秦玉华 丁香乾 宫会丽关键词:近红外光谱 主成分分析 卷烟 一种配方产品感官质量的数字化评估方法 本发明公开了一种配方产品感官质量的数字化评估方法,包括:利用m个配方产品的测量数据作为训练样本,建立训练样本矩阵X;结合专家对训练样本的品评结果,建立专家感官品评向量Y;将测试样本x<Sub>m+1</Sub>加入训练样... 宫会丽 杨宁 秦玉华融合多粒度信息的用户画像生成方法 被引量:2 2024年 现有用户画像方法缺乏不同粒度文本信息表示,且特征提取阶段存在噪声,导致构建画像不够准确。针对以上问题,提出一种融合多粒度信息的用户画像生成方法(user profile based on multi-granularity information fusion,UP-MGIF)。首先,该方法在嵌入层融合字粒度、词粒度表示向量以扩充特征内容;其次,在改进双向门控循环单元网络基础上,结合降噪自编码器和注意力机制设计一种特征提取混合模型Bi-GRU-DAE-Attention,实现特征降噪和语义增强;最后,将鲁棒性强的特征向量输入到分类器中实现用户画像生成。实验表明,该用户画像生成方法在医疗和互联网两个画像数据集上的分类准确率高于其他基线方法,并通过消融实验验证了各个模块的有效性。 邵一博 秦玉华 崔永军 高宝勇 赵彪关键词:特征提取 基于GIS地下管网可视化系统的开发 2005年 本系统针对地下管网的特点,完成了管网信息输入、编 辑、查询统计及裁剪输出等功能。利用GIS(Geographic Information System)技术较好地解决了基于地理定位的图形描述、管理等问题, 实现了图形信息和属性数据的较好联接,使得这两类信息的互相查询 以及协同完成的各种管理、分析功能得以实现。 秦玉华 苏宝茹关键词:GIS 地下管网 可视化系统 地理信息系统 核映射和Rank-Order距离的局部保持投影相似性度量方法 被引量:3 2021年 针对近红外光谱高维、高冗余、非线性和小样本等特点导致光谱相似性度量时出现的“维度灾难”,提出一种基于核映射和rank-order距离的局部保持投影(KRLPP)算法。首先将光谱数据经过核变换映射到更高维空间,有效保证了流形结构的非线性特征。然后改进局部保持投影(LPP)算法对数据进行降维操作,将rank-order距离替代传统的欧氏距离或测地线距离,通过共享邻近点的信息,得到更加准确的局部邻域关系。最后在低维空间通过距离的计算实现光谱的度量。该方法不仅有效解决了高维空间存在的“距离失效”问题,同时还提高了相似性度量结果的精度。为了验证KRLPP算法的有效性,首先根据降维前后数据集信息残差的变化确定了最佳参数近邻点的个数k和降维后的维数d。其次,从光谱降维投影效果和模型分类效果两个角度与PCA,LPP和INLPP算法进行了对比,结果表明KRLPP算法对于烟叶的部位有较好的区分能力,降维效果以及对于不同部位的正确识别率明显优于PCA,LPP和INLPP。最后,从某品牌卷烟叶组配方中选取了5个代表性烟叶作为目标烟叶,分别采用PCA,LPP和KRLPP方法从300个用于配方维护的烟叶样品中为每个目标烟叶寻找相似烟叶,并从化学成分和感官评价两方面对替换前后的烟叶及叶组配方进行了评价分析。其中LPP和KRLPP用于降维的参数选择保持一致,PCA选择前6个主成分。结果表明,由KRLPP选出的替换烟叶与替换配方在总糖、还原糖、总烟碱、总氮等化学成分以及香气、烟气、口感等感官指标上较PCA、LPP方法差异最小,相似性度量准确度最高。该方法可应用于配方产品替换原料的查找,辅助企业实现产品质量的维护。 秦玉华 张萌 杨宁 单秋甫关键词:近红外光谱 核映射 基于VB的同尾号缩水软件的开发 2007年 针对彩票选号方面的问题,提出了一种计算方法——同尾号分析法。同时对于同尾号产生、排列部分的设计和实现进行了详细的介绍。 秦玉华关键词:遍历算法 一种新的鲁棒恒虚警检测器 被引量:2 2008年 本文基于自动删除单元平均(ACCA)方法和单元平均(CA)方法,提出了一种新的恒虚警检测器(ACGCA-CFAR)以提高CFAR检测的抗干扰性能。它的前沿和后沿滑窗分别采用ACCA和CA方法产生两个局部估计,然后取最大值作为背景噪声功率水平估计。在SwerlingII型目标假设下,推导出ACGCA在均匀背景下虚警概率Pfa的解析表达式,并与现有方案进行了比较,仿真和试验数据处理结果表明:ACGCA-CFAR在均匀背景和非均匀背景下均具有相当好的检测性能,而它的样本排序时间只有OS和ACCA的1/4。 秦玉华 郝程鹏关键词:恒虚警 一种近红外光谱设备的稳定性判别方法 本发明公开了一种近红外光谱设备的稳定性判别方法,包括标样光谱稳定性模型构建过程以及实测光谱稳定性判别过程,通过构建稳定性模型并计算扫描光谱的稳定性指数,从而可以客观地判别出未知扫描光谱的稳定性,进而根据扫描光谱的稳定性可... 宫会丽 丁香乾 杨宁 于雪涛 秦玉华文献传递