魏晓聪
- 作品数:6 被引量:38H指数:2
- 供职机构:大连理工大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于时态信息的数据有效性和处理权限的处理方法研究
- 2007年
- 本文在时态信息对数据有效性和数据处理权限影响分析的基础上,提出了将时态数据值与相关数据的有效性和数据处理权限的关系组织成时态值关系数据表,与时态数据和正常数据形成的数据表一起组织成数据库。在系统处理中,采用统一的数据库查询处理方法,完成信息系统随时间变化的处理的方法。
- 张江涛邵立凤魏晓聪
- 关键词:时态信息数据有效性
- 面向迁移学习的文本特征对齐算法被引量:7
- 2017年
- 源领域和目标领域特征空间的不一致导致迁移学习准确率下降。为此,提出一种基于Word2Vec的不同领域特征对齐算法。只选取形容词、副词、名词、动词作为特征,针对每种词性,选择源领域和目标领域的枢纽特征,分别在源领域和目标领域为该枢纽特征计算出与之语义相似度最大的非枢纽特征,将其作为相似枢纽特征,从而为每个枢纽特征构成一个相似枢纽特征对。将出现在这些领域中的每一个相似枢纽特征按照枢纽特征对进行特征替换,从而将不同领域语义相似的特征进行对齐,并在特征替换后的源领域和目标领域数据上进行机器学习。实验结果表明,该算法的平均分类精度达到88.2%,高于Baseline算法。
- 魏晓聪林鸿飞
- 关键词:情感分析
- 一种用于构建用户画像的二级融合算法框架被引量:30
- 2018年
- 用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作是给用户贴"标签"。基于用户的查询词历史记录,提出一种用于预测用户多维标签的二级融合算法框架。在第一级模型中,分别在各个标签预测子任务上建立多种模型,使用传统机器学习方法与Trigram特征相结合来抽取用户用词习惯的差异,使用doc2vec浅层神经网络模型来抽取查询词的语义关联信息,使用卷积神经网络模型来抽取查询词之间的深层语义关联信息。实验表明,doc2vec在处理用户查询这样的短文本相关任务时有着相对较好的预测准确性。在第二级模型中,针对用户画像这样的多标签预测任务,使用XGBTree模型及Stacking多模型相融合的方法提取出用户各标签属性之间的关联信息,使得平均预测准确率进一步提高了2%左右。在2016年中国计算机学会(CCF)组织的大数据竞赛《大数据精准营销中搜狗用户画像挖掘》中,所提二级融合算法框架在894支队伍中夺得了冠军。
- 李恒超林鸿飞杨亮徐博魏晓聪张绍武古丽孜热.艾尼外
- 基于情感距离和领域自适应的评论者声誉度被引量:1
- 2017年
- 为有效地从评论文本中评估消费评论者的声誉度,本文提出一种基于情感距离和领域自适应的评论者声誉度评估方法。通过度量待评估评论者发表的商品评论与该商品其他评论者的情感距离、情感倾向一致性,从而衡量该消费评论者在评价商品时的客观性以及与大众情感极性的一致性。最后,以亚马逊产品评论为实验语料,与亚马逊Reviewer ranking排序结果进行对比表明该方法的合理性。该方法对评论文本有效性研究以及规范电商平台消费者行为具有重要意义。
- 魏晓聪林鸿飞杨亮
- 关键词:评论者情感距离领域自适应
- 对多声道音频文件的基于旋律的音频检索系统设计
- 2008年
- 基于音频相关属性信息进行检索的音乐检索系统具有较大的局限。近年来,基于旋律的音频检索技术的研究成为音频检索技术的热点课题,对单声道音频的旋律特征提取算法作了较深入的研究。本文在分析音乐旋律表达的基础上,研究多声道文件的旋律特征,提出了多声道文件的旋律提取方法,设计完成了面向多声道MIDI格式文件的基于哼唱的音频检索系统。结果表明,系统具有良好的检索功能。
- 魏晓聪路莹唐晓君李鑫
- 关键词:音频检索多声道特征提取
- 基于内容的多声道音频检索系统开发
- 现有网上音乐检索局限于类浏览和基于文字的查找功能。为了寻找一首乐曲,用户必需准确地知道标题、作者、演奏家或者其他相关的文字描述,否则就只能花费大量时间,逐一浏览这个音乐分类下的所有乐曲。这种基于文本的信息检索方式,脱离实...
- 魏晓聪
- 关键词:音频检索多声道音频
- 文献传递