刘丛 作品数:44 被引量:176 H指数:8 供职机构: 上海理工大学光电信息与计算机工程学院 更多>> 发文基金: 国家自然科学基金 上海市自然科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 天文地球 交通运输工程 更多>>
S2SA-BiLSTM:面向法律纠纷智能问答系统的深度学习模型 被引量:3 2019年 利用司法领域的网络资源对用户所提的法律纠纷问题自动提供有价值的参考解决方案能在很大程度上降低人工成本和社会资源.为了智能化解决用户的法律纠纷问题,论文提出一种seq2seq(Sequence to Sequence,序列到序列)融合注意力模型和双向长短时记忆网络的法律纠纷自动问答深度学习模型——S2SA-Bi-LSTM.该模型从大规模法律纠纷问答对出发,利用BiLSTM获取输入序列的上下文信息,结合注意力机制对序列权重进行更新,通过编码得到输入序列的向量化表示.并在此基础上,本文修改了Bi-LSTM中输入门和遗忘门的参数并计算输出序列,以得到与输入序列相对应的输出序列.实验证明,所提模型在真实的数据集上生成的答案具有较高的准确率,MAP值和MRR值也优于已有研究. 涂海 彭敦陆 陈章 刘丛基于改进遗传算法的不规则图形排样 被引量:9 2010年 针对大规模零件和布料优化排样问题,研究遗传算法在智能排样中的应用及其在智能优化排样中的优缺点。以传统遗传算法优化排样为基础,提出一种改进的基于遗传算法的优化排样算法,利用图形间的相似度对图形群体进行分类,降低遗传算法的时间复杂度。实验结果证明,该方法在时间复杂度上优于传统的遗传算法优化排样,适用于大规模的图形排样系统。 唐坚刚 刘丛 张丽红关键词:排样 遗传算法 相似度 时间复杂度 海量法律文书中基于CNN的实体关系抽取技术 被引量:18 2018年 传统文本实体关系抽取算法多数是基于特征向量对单一实体对语句进行处理,缺少考虑文本语法结构及针对多对实体关系的抽取算法.基于此,提出一种基于CNN(Convolutional Neural Network)和改进核函数的多实体关系抽取技术—KMCNN(Multi-Entity Convolutional Neural Network Based on Kernel),并将所提技术运用于海量法律文书的实体关系抽取上.KMCNN从抽取大规模历史法律文书的人物关系出发,构建短语有效子树,采用基于改进的核函数来计算短语有效子树的相似度,以实现运用CNN算法对多对实体关系进行挖掘的目标.在真实数据集上的实验表明,所提技术具有较好的抽取效果和较高的计算效率. 高丹 彭敦陆 刘丛关键词:实体关系抽取 核函数 CNN 基于智能选择多维特征的肺部CT图像检索 被引量:2 2010年 单一特征检索图像和手工设置多维加权系数特征检索图像越来越不能满足基于内容图像检索精度的需要,为此提出一种基于训练样本集聚类的多维特征向量加权算法。该算法需要手工建立训练样本集,提取出每个图像的颜色、纹理和形状等多维特征,使用遗传算法寻找特征向量集的最优加权系数序列,最后使用该加权序列计算测试集的特征值进行图像检索。实验证明,该算法相对于单一特征检索和手工设置多维特征加权在检索的准确度上有一定的提高,并且在相似度比较高的两个聚类检索时,有很高的准确性。 刘丛 唐坚刚 张丽红关键词:图像检索 训练样本集 遗传算法 基于形状边缘点夹角直方图的图像检索研究 被引量:1 2010年 针对形状特征图像检索具有平移、旋转和尺寸不变性的优点,提出了一种直接在边缘曲线上提取特征的方法,该方法利用边缘点的夹角直方图作为特征向量.经实验表明:该方法能有效提高图像检索的精确度,并能缩短检索时间. 唐坚刚 刘丛 张丽红关键词:图像检索 特征向量 研究生《计算智能》课程教学方法探讨 2016年 计算智能是一门理论基础比较强的课程。本文结合近几年计算智能课程教学中教学经验和教学体会,总结出一套新的教学模式。该模式主要包括启蒙-自学-讨论完善等三个阶段。该模式对目前的计算智能学习者具有一定的参考价值。 刘丛 邬春学 蒋林华关键词:教学经验 教学模式 Trans-NER:一种迁移学习支持下的中文命名实体识别模型 被引量:15 2019年 目前存在的中文命名实体识别方法依赖于大量标注数据,但是某些领域标注数据的获取成本十分高昂.通过引入迁移学习技术,降低了实体识别模型对于大量标注数据的需求.论文从大规模非结构化文本数据出发,利用双向循环神经网络构建语言预测模型,将其作为迁移学习源模型;同时,基于上下文特征的字符级向量生成算法迁移源模型知识至实体识别模型,最终构建出迁移学习模型:Trans-NER.实验结果显示,提出的模型表现优于其他实体识别模型. 王银瑞 彭敦陆 陈章 刘丛关键词:自然语言处理 命名实体识别 AM-CNN:一种基于注意力的卷积神经网络文本分类模型 被引量:17 2019年 目前,大多数公开的文本分类数据集是相对平衡的,但对于真实文本分布来说,通常会出现类别极端不平衡的情况,这样的数据集会对模型训练产生影响.针对该问题,论文提出了一种基于卷积神经网络和注意力机制的文本分类算法——AM-CNN(Convolutional Neural Network with Attention Mechanism).算法利用循环神经网络捕捉文本的上下文信息,通过引入注意力机制得到文本类别的特征向量矩阵后运用卷积神经网络模型完成文本的分类,以降低在文本分类的训练过程中对小类别的不公平.实验结果表明,该算法对于提高文本分类的精度有较显著的效果. 王吉俐 彭敦陆 陈章 刘丛关键词:文本分类 循环神经网络 卷积神经网络 结合形态学重建和超像素的多特征FCM分割算法 2021年 针对现有模糊聚类分割算法对噪声的鲁棒性差且提取的图像特征不充分等问题,本文提出了一种结合形态学重建和超像素的多特征模糊C-均值(FCM)分割算法.首先,利用形态学闭合重建处理原图像,提高了算法的鲁棒性和细节保护能力.其次,采用Mean-Shift方法预分割重建图像,获得一组超像素区域.再次,提取重建图像各像素的颜色特征、纹理特征和梯度特征,利用平均策略定义各超像素的颜色特征、纹理特征和梯度特征,组成多维特征向量.最后,运用最大熵正则化的加权模糊C-均值算法(EWFCM)的框架,以超像素为单位,以核诱导距离作为距离度量来聚类多维特征向量.选取BSDS300数据集中的6幅图像完成实验对比.结果表明,本文算法具有更高的分割精度. 马喃喃 刘丛关键词:形态学重建 MEAN-SHIFT 基于案例的《机器学习》课程教学方法研讨 被引量:6 2018年 机器学习处于人工智能的核心位置,对机器学习研究和人工智能发展具有非常重要的推动作用。由于机器学习涉及到太多数学背景而提高了学习者学习难度,并且学习者基础薄弱也制约了其学习深度。针对机器学习的学习现状及学习者面临的问题,提出分层次学习方法。该方法可让学习者对知识点的理解由浅入深、层层深入,并且让不同需求的学习者认清学习目标。实践证明,该方法提高了学习者积极性,能很好地使学习者入门、深入及精通,提高了学习效率。 刘丛 彭敦陆 邬春学关键词:人工智能