李丹
- 作品数:19 被引量:25H指数:2
- 供职机构:中国科学院信息工程研究所更多>>
- 发文基金:新疆维吾尔自治区科技计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于Lenet-5的卷积神经网络改进算法被引量:19
- 2016年
- 在当前语音识别和图像识别领域,卷积神经网络已经取得了很大的成功。现有的Lenet-5卷积神经网络是多层网络结构,但是大量实验表明,从全链接层到输入层的回调影响了最终的精度,特别是在有限数据量的情况下。因此提出了单层回调的Lenet-5算法,即在Lenet-5卷积神经网络的卷积层后添加一个临时输出层,与真实标签进行比较,根据误差函数对层间参数进行回调,并用全球手写数字MNIST数据集进行训练和测试。实验表明,即使在有限数据量的情况下算法的精度仍能得到提高。
- 李丹沈夏炯张海香朱永强
- 关键词:卷积神经网络卷积回调
- 基于用户特征的预测社交网络信息流行度的方法及系统
- 本发明提供了基于用户特征的预测社交网络信息流行度的方法,该方法包括:获取社交网络中的用户数据和信息数据;从用户数据中提取部分用户属性特征及用户行为特征;根据用户属性特征和用户行为特征将用户数据进行分类;根据信息数据及用户...
- 李歌胡玥于延宇李丹
- 文献传递
- 一种密文检索方法
- 本发明公开了一种密文检索方法,在客户端实现层次聚类的创建和索引的加密,服务器接收密文查询向量,通过基于层次聚类的密文索引可计算出各个文档向量和查询向量之间的相关度分数,并且根据该相关度分数实现文档排序功能,由于查询过程中...
- 陈驰朱晓杰申培松田雪于晶王朝刚杨腾飞李丹
- 文献传递
- 一种对社交网络信息传播趋势预测的方法及系统
- 本发明涉及一种对社交网络信息传播趋势预测的方法及系统,包括获取社交网络中的信息数据和用户数据,利用用户数据计算出用户类别分布向量;对信息数据进行归一化处理;利用移动平均方法对归一化的信息数据进行平滑处理,结合Diffus...
- 于延宇胡玥李歌李丹
- 文献传递
- 一种中文仿冒域名检测方法及系统
- 本发明公开了一种中文仿冒域名检测方法及系统,适用于检测利用形近字构造的中文仿冒域名。主要包括:用于统计每个输入域名的长度和总笔画数的域名预处理模块;对比待检测域名与目标域名的长度和总笔画数,过滤出可能被仿冒的目标域名集合...
- 王利明李丹
- 文献传递
- 一种基于HBase的高效半结构化数据查询策略被引量:1
- 2014年
- 本文用以Dremel系统为基础解决在HBase系统下如何查询大量的半结构化数据。基本原理是进行先进行数据预处理将半结构化数据进行拆分,将记录拆分成列使用表存储,拆分之后保持原有之间的半结构化数据的树之间的上下层关系,然后再查询的时候只查询条件相关的列,然后做集合计算,即可得到数据需要查询的结果,从而节省了很多时间。
- 仇伟涛范家铭李丹
- 关键词:大数据HBASE半结构化数据
- 一种基于混合狄利克雷过程的网络水军行为检测方法及系统
- 本发明涉及一种基于混合狄利克雷过程的网络水军行为检测方法及系统,其方法为,采集包括用户行为特征和内容特征的原始数据,并对每个维度的原始数据进行量化表示构成用户的历史行为向量,构成待聚类用户数据集;对待聚类用户数据集中的历...
- 李丹李倩牛温佳管洋洋黄超孙卫强胡玥郭莉
- 文献传递
- HDFS小文件读写优化策略
- 2016年
- HDFS是一种高容错性的分布式系统。它支持的数据集在GB到TB级别,然而对大量小文件存取支持不足。由于在处理大数量级的小文件时,会使得Name Node内存消耗过度,造成文件的存取性能降低。因此提出了一种根据文件类型分类小文件的合并策略。通过建立索引信息服务器来存储存放在用户文件中的小文件的元数据信息,可以达到高效读取小文件的目的。实验结果表明,该优化策略能有效降低Name Node内存消耗,提高HDFS文件系统对大量小文件读取效率。
- 朱永强周珂李丹赵亚萌
- 关键词:HDFS用户文件元数据信息
- 一种密文检索方法
- 本发明公开了一种密文检索方法,在客户端实现层次聚类的创建和索引的加密,服务器接收密文查询向量,通过基于层次聚类的密文索引可计算出各个文档向量和查询向量之间的相关度分数,并且根据该相关度分数实现文档排序功能,由于查询过程中...
- 陈驰朱晓杰申培松田雪于晶王朝刚杨腾飞李丹
- 一种基于行为特征与内容特征融合的水军识别方法及系统
- 本发明涉及一种基于行为特征与内容特征融合的水军识别方法及系统,其方法为,采集包括用户行为特征和内容特征的原始数据;利用马尔可夫链蒙特卡罗随机模型进行行为特征维度和内容特征维度的融合,组成用户特征向量;利用用户特征向量进行...
- 牛温佳李倩管洋洋黄超孙卫强李丹胡玥郭莉
- 文献传递