谢元澄 作品数:19 被引量:74 H指数:4 供职机构: 南京农业大学信息科学技术学院 更多>> 发文基金: 中央高校基本科研业务费专项资金 国家科技重大专项 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 农业科学 生物学 更多>>
基于word2vec和LSTM的句子相似度计算及其在水稻FAQ问答系统中的应用 被引量:16 2018年 [目的]水稻FAQ(frequently asked question,常问问题集)问答系统对农户在水稻种植过程中遇到的问题进行解答,问句相似度计算是其核心,用来匹配用户问题和FAQ中的问题。针对传统句子相似度算法准确率普遍较低的问题,本研究旨在用深度学习计算问句相似度,以提高系统回答的准确性。[方法]构建一个基于word2vec和LSTM(long-short term memory,长短期记忆)神经网络,包括输入层、嵌入层、LSTM层、全连接层和输出层的句子相似度模型。对水稻FAQ中的3 007个问题进行归类和组合得到32 072个问题对,并标注其相似性作为训练和测试数据。使用基于农业领域语料库训练得到的word2vec模型对训练数据向量化后作为输入,训练句子相似度模型。[结果]在测试集上对模型进行验证,并与基于How Net、基于词向量的余弦距离以及基于word2vec和卷积神经网络(convolutional neural network,CNN)的3种句子相似度算法进行对比。对句子相似度的计算结果进行抽样检查,该模型的计算结果更符合人的直观印象。从准确率和ROC(receiver operating characteristic curve)曲线进行分析,该模型也明显优于其他3种方法,准确率达到了93.1%。[结论]本研究构建的模型显著提升了句子相似度计算的准确率,基于该模型开发的水稻FAQ问答系统,能够准确匹配用户问题和水稻FAQ中的问题,帮助农户更好地解决水稻生产中遇到的问题。 梁敬东 崔丙剑 姜海燕 沈毅 谢元澄关键词:水稻 问答系统 复杂大田场景中麦穗检测级联网络优化方法 被引量:9 2020年 单位种植面积的麦穗数量是评估小麦产量的关键农艺指标之一。针对农田复杂场景中存在的大量麦芒、卷曲麦叶、杂草等环境噪声、小尺寸目标和光照不均等导致的麦穗检测准确度下降的问题,提出了一种基于深度学习的麦穗检测方法(FCS RCNN)。以Cascade RCNN为基本网络模型,通过引入特征金字塔网络(Feature pyramid network,FPN)融合浅层细节特征和高层丰富语义特征,通过采用在线难例挖掘(Online hard example mining,OHEM)技术增加对高损失样本的训练频次,通过IOU(Intersection over union)阈值对网络模型进行阶段性融合,最后基于圆形LBP纹理特征训练一个SVM分类器,对麦穗检出结果进行复验。大田图像测试表明,FCS RCNN模型的检测精度达92.9%,识别单幅图像平均耗时为0.357 s,平均精度为81.22%,比Cascade RCNN提高了21.76个百分点。 谢元澄 何超 于增源 沈毅 姜海燕 梁敬东基于特征选择集成学习的果蝇求偶行为识别 被引量:3 2011年 设计一个机器学习分类算法,实现对果蝇求偶行为的自动识别。在对图片规范化的基础上,提取图像局部二元模式统计特征与沃尔什特征获得果蝇求偶图像纹理几何特征。通过基于特征选择的集成学习来构建一个强分类器,实现对果蝇求偶行为的检测;采用十折交叉验证的方法进行验证,检测结果优于传统的图像处理分割算法。基于特征选择快速选择性集成,效率高于传统集成方法,基于特征选择集成学习识别昆虫的复杂纹理是可行的。通过机器学习方法来识别果蝇行为谱可以实现大规模的行为筛查,这将有助于基因和神经回路控制行为的研究。 谢元澄 梁敬东 王书平 余倩倩 李飞关键词:弱分类器 牦牛DAZL基因编码区的克隆和序列特征与进化分析 被引量:3 2010年 根据黄牛DAZL基因序列设计引物,通过PCR扩增和克隆测序获得牦牛睾丸组织DAZL基因编码区序列,利用生物信息学软件分析牦牛DAZL基因编码区序列结构以及与其他物种的系统发育关系。结果表明:牦牛DAZL基因cDNA序列长度为1 782 bp,编码区全长885 bp,编码295个氨基酸,与黄牛的氨基酸序列同源性为98.31%;牦牛DAZL蛋白含有DAZ基因家族所具有的典型的RNA结合域和DAZ重复基序。系统发育分析显示:牦牛与黄牛首先聚为一类,然后与哺乳纲的其他物种相聚,而与鱼纲、爬行纲动物的亲缘关系最远。 李新福 谢元澄 张庆波 赵兴波 顾垚 朱翔 谢庄 李齐发关键词:牦牛 编码区 系统发育 一种自适应的运动目标模糊边缘检测方法 提出了一种有选择的局部背景快速分割方法;针对模糊边缘难以检测的问题.提出一种将梯度法与灰度阈值法相结合的方法.该方法首先通过大津法确定目标的位置;然后在其邻域内求出关于灰度值分布的直方图的极值点,再通过灰度阈值法得到目标... 孙吉祥 梁敬东 谢元澄 方圆 高瑞 李旭东关键词:图像处理 边缘检测 自适应模糊控制 文献传递 基于牛肉大理石花纹标准(BMS)图像的纹理特征分析 被引量:9 2010年 【目的】研究基于图像纹理特征来描述牛肉大理石花纹标准的方法。【方法】以日本、美国和澳大利亚的牛肉大理石花纹分级图像为基础,通过线性回归的方法来研究纹理特征与牛肉大理石花纹标准之间的内在关系。【结果】通过彩色梯度和局部二值模式(LBP)处理后提取灰度共生矩阵的4个特征:对比度、相关度、能量和一致性,这些特征可以准确地描述3个不同国家的牛肉大理石花纹标准。其中,能量特征对图像的差异性不敏感,可以作为3种牛肉大理石花纹标准的共性特征。【结论】基于牛肉LBP纹理特征的线性回归预测模型可以作为牛肉大理石花纹标准的一项合理评估依据。 谢元澄 徐焕良 谢庄关键词:彩色梯度 局部二值模式 灰度共生矩阵 一种自适应的运动目标模糊边缘检测方法 被引量:3 2012年 提出了一种有选择的局部背景快速分割方法;针对模糊边缘难以检测的问题,提出一种将梯度法与灰度阈值法相结合的方法。该方法首先通过大津法确定目标的位置;然后在其邻域内求出关于灰度值分布的直方图的极值点,再通过灰度阈值法得到目标的初步边缘;最后根据梯度信息对边缘进行微调,减少了灰度不均匀等因素造成的影响。实验结果表明,文中的方法可以有效地提高模糊边缘的检测效率。 孙吉祥 梁敬东 谢元澄 方圆 高瑞 李旭东关键词:边缘检测 梯度法 果蝇求偶行为计算机检测识别方法 被引量:3 2011年 为解决果蝇求偶行为难以检测与识别的问题,探讨了基于图形图像处理技术的果蝇求偶行为的微机检测与识别的方法与步骤:包括用动态恢复背景的方法进行背景恢复、果蝇身体提取、合成果蝇个体二值图像、翅膀提取等。设计了求偶果蝇检测算法,并基于VC++和Opencv开发系统予以实现。结果表明,该方法克服了人工识别费时费力的问题并具有较高的可靠性。该研究结果可以扩展,在生物及细胞的表型与行为认知中得到广泛应用。 梁敬东 余倩倩 谢元澄 张云 王书平 胡文斌 李飞关键词:图形图像处理 果蝇 求偶 OPENCV 面向系统能力培养目标的大学生科技素养训练方法探索——以计算机专业为例 被引量:1 2017年 系统化设计能力是检验计算机类毕业生质量的标准之一,也是大学生科研素养和创新能力的重要表征面。近十年来,每年指导至少一项计算机系学生的各级SRT训练,积累了一些经验。通过导师制和校级、省级、国家级SRT项目训练,激发了学生的创新力,培养了学生的基本科技素养,进而具备了进行科研的基本分析问题、解决问题的能力,初步达到面向系统能力的培养目标。 郭小清 谢忠红 谢元澄关键词:程序设计 以提高能力为主线的C语言程序设计实验课的教学方法探讨 2014年 本文针对《C语言程序设计实验》教学中教学累、效果差的问题,提出了一种以提高学生能力为主线教学改革方法。主要的改革措施包括分阶段精选实验题目、以助教为核心的分组式学习方式以及分阶段多次考试的考核方式。与教学改革前相比学生的实验成绩的优秀和良好率总和提高了15%,而不及格率降低了近6%,结果表明本文提出的教学改革方法提高了学生自主学习的意识,显著提高了实验教学质量。 谢忠红 郭小清 谢元澄 姜海燕关键词:C语言 助教