国家科技支撑计划(2011BAH11B03)
- 作品数:27 被引量:140H指数:6
- 相关作者:吕学强施水才都云程肖诗斌刘挺更多>>
- 相关机构:北京信息科技大学北京拓尔思信息技术股份有限公司哈尔滨工业大学更多>>
- 发文基金:国家科技支撑计划国家自然科学基金北京市教委科技发展计划更多>>
- 相关领域:自动化与计算机技术文化科学机械工程自然科学总论更多>>
- 基于极性词典的中文微博客情感分类被引量:27
- 2014年
- 微博客是近年来自然语言处理领域研究的热点。主要针对中文微博客中的情感分类展开研究。结合网络新词和基础情感词,同时考虑了情感词的极性情感强弱,构建四个词典,分别是基础情感词典、表情符号词典、否定词词典和双重否定词词典;在情感词典的基础上,融合汉语语言学特征和微博情感表达特征,提出一种新的基于极性词典的情感分类方法。实验准确率达到82.2%。实验结果表明,提出的方法可以对中文微博进行较好的情感分类,有一定的应用价值。
- 王勇吕学强姬连春肖诗斌
- 关键词:情感分类词典语言学特征
- 机械设计图像几何特征组合检索研究被引量:1
- 2013年
- 基于内容的机械设计图像检索对机械设计行业有重要作用。提出一种基于几何特征组合的机械设计图像检索方法。通过机械设计图像形状区域对应的面积、周长等信息,得到7个具有不变性的几何特征如密实度、矩形度等,并将7个特征进行组合,构成机械设计图像的形状特征描述符,用于机械设计图像检索。该形状特征描述符具有易于计算和无需归一化的特点。实验表明,该方法在机械设计图像检索中的性能优于傅里叶描述符方法和Hu不变矩方法。
- 方乃伟吕学强张丹
- 关键词:图像检索
- 中文专利文献术语抽取被引量:10
- 2013年
- 为了有效解决专利文献中术语抽取问题,提出采用字符串之间的结合强度融合词性过滤法抽取术语的方法。根据专利文献中术语出现的特点,提出了字符串之间的边界结合度方法和字符串之间的串边结合度方法,度量了字符串间的结合强度。在此基础之上,根据术语内部结构中词性的组成特点,提出了术语双字词性过滤的方法,并与结合强度的计算方法进行融合。实验结果表明,该方法对中文专利术语抽取有很好的效果,平均正确率为80.24%,平均召回率为80.61%。
- 徐川施水才房祥吕学强
- 基于特定目标的Radon变换模糊图像研究被引量:5
- 2013年
- 对运动模糊图像进行恢复处理需要两个关键参数的支持:模糊角度和模糊长度。为此,提出了一种时间复杂度比传统Radon变换更低的新方法对频域中的图像进行角度检测。根据傅里叶频谱的特性,新方法以扇形方式展开,扫描出一条穿过圆心且亮度最大的直线,该直线的倾斜角度为频域图像中平行条纹的倾斜角度;利用Radon变换的性质将先前求得的模糊角度进行投影求和得到模糊长度。实验结果表明,新方法不仅降低了时间复杂度,还提高了模糊角度和模糊长度检测的准确性。
- 杨梅施水才房祥吕学强
- 关键词:RADON变换
- 基于字同现频率的关键词自动抽取被引量:4
- 2011年
- 为提高关键词自动抽取的准确率,提出了基于字同现频率的关键词自动抽取算法。根据词的位置和文本长度改进TF/IDF算法,由字同现频率计算词的信息量,运用特征加权计算词的权重,选取权重大的词作为关键词。给出了关键词自动抽取的过程,设计了关键词抽取的对比实验,验证该算法的有效性。实验结果表明该算法在准确率和召回率上具有优势。
- 都云程周伟韩艳铧吕学强
- 关键词:关键词自动抽取
- 基于模板匹配及曲线拟合的视频字幕细化研究
- 2014年
- 在视频字幕识别过程中,由于字幕像素比较低,使得二值化后,汉字边缘出现不规整的锯齿。针对该类汉字的细化,提出基于模板匹配及曲线拟合的方法。用角度为0°、45°、90°、135°的线段作为模板,分别匹配汉字中"横"、"撇"、"竖"、"捺"笔划,实现笔划提取;用二次Bezier曲线拟合"撇"、"捺"笔划,实现笔划重绘。对比实验表明,该方法对视频字幕的细化是有效的,且结果可以更好地被识别。
- 李钦瑞都云程刘坤吕学强
- 关键词:笔划
- 基于加权距离的机械设计图像异步检索方法被引量:5
- 2013年
- 根据机械设计图像的形状特征,提出一种利用加权距离实现的多特征异步检索方法。首先利用机械设计图像的外接圆距离特征进行初步检索,再结合初步检索结果集的位置计算输入图像和初步检索结果集的加权Hu不变矩特征距离,并据此获得最终的检索结果。实验表明,与单一特征的检索方法相比,该方法在机械设计图像检索中有更高的查准率和查全率。
- 方乃伟吕学强张丹王弘蔚
- 关键词:HU不变矩加权距离
- 汉语并列关系的识别研究被引量:7
- 2013年
- 针对汉语并列关系的标注方式,提出一种基于条件随机场模型的并列关系自动识别方法。从语料库中自动抽取并列关系的角色信息,进行角色标注,在条件随机场模型的基础上实现并列关系的识别。与基于图的依存分析方法比较,并列关系的召回率和正确率分别提高了9.1%和13.8%。
- 郑略省吕学强刘坤林进
- 关键词:依存句法分析条件随机场角色标注
- 基于扩展射线法的三维模型检索
- 2013年
- 针对原始射线法特征提取时间较长、仅利用三角形面片问题,提出一种基于不相交平面束原理的扩展射线法。从质心均匀散射出一组射线与三角形面片相交,利用射线确定的不相交平面束定位交点;根据交点、顶点到质心的距离,建立检索模型以改善三维模型的检索效果。利用普林斯顿大学三维模型库的10类模型作为实验数据,实验结果表明:与原始射线法对比,扩展射线法不仅提高了特征提取速度,而且提高了检索准确率。
- 姜阳吕学强李琳施水才
- 关键词:三维模型检索时间复杂度
- 中文微博突发事件检测研究被引量:24
- 2013年
- 从微博中准确而高效地挖掘出突发事件是近年来的研究热点。通过词频统计、词增长率计算和TF-PDF算法抽取突发词集,使用突发词表示文本并结合微博突发事件的描述特征进行文本过滤;提出一种"绝对聚类"算法,对描述突发事件的文本进行聚类,并通过微博的回复数和转发数加权计算热度,检测各类事件中热度最大的作为突发事件。检测准确率为92.60%,召回率为85.51%,F值为0.89。实验结果表明,相比于传统的突发事件检测方法,该方法能够比较准确地检测到微博中的突发事件,有一定的应用价值。
- 王勇肖诗斌郭跇秀吕学强
- 关键词:突发事件文本过滤