唐亚伟
- 作品数:4 被引量:10H指数:2
- 供职机构:渤海大学信息科学与技术学院更多>>
- 发文基金:辽宁省教育厅高校重点实验室项目国家自然科学基金辽宁省自然科学基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 基于数据挖掘的分类算法综述被引量:6
- 2011年
- 分类算法是数据挖掘中最重要的研究领域之一。通过对当前数据挖掘中具有代表性的优秀分类算法进行分析和比较,给出了每种算法的特性,为使用者选择算法或研究者改进算法提供了依据。
- 唐亚伟秦玉平
- 关键词:数据挖掘
- 公式相似度算法及其在论文查重中的应用研究
- 随着信息技术的发展以及互联网的普及,人们获取信息的方式越来越便利。为了更加方便、快捷地共享与交流新的学术研究成果,学术资源网络化已经成为发展趋势,但网络学术资源的共享性质以及获取成本的降低,使得抄袭、剽窃等不道德行为日益...
- 唐亚伟
- 关键词:抄袭检测相似度LATEX
- 文献传递
- 一种基于二叉树的数学公式匹配算法被引量:3
- 2013年
- 提出了一种基于二叉树结构的LaTeX格式数学公式匹配算法。首先根据数学公式的LaTeX格式生成其二叉树表示,并对树形结构作归一化处理,然后先序遍历二叉树得到公式元素序列,并对序列中的变量名称作归一化处理。对于待匹配的两个数学公式,根据两个公式元素序列对应位相同的公式元素数计算两个公式的相似度。实验结果表明,该算法实现了数学公式的准确匹配,是一种较实用的算法。
- 秦玉平唐亚伟伦淑娴王秀坤
- 关键词:二叉树归一化相似度
- 一种基于二叉树的数学公式抄袭检测算法
- 2015年
- 提出了一种基于二叉树的LaTeX格式数学公式抄袭检测算法。在待检测文档中提取数学公式,根据数学公式的LaTeX格式生成其二叉树表示,对树形结构作归一化处理得到结构码;在公式检测库中查找文件名为该结构码的数据表,若该数据表存在,则在数据表中查找与二叉树根结点公式元素和变量名归一化的先序遍历序列都相同的记录;根据查找结果确定数学公式是否为抄袭。实验结果表明,该算法准确地实现了数学公式的抄袭检测,是一种较实用的算法。
- 秦玉平唐亚伟伦淑娴王秀坤
- 关键词:抄袭检测二叉树归一化