苏绥 作品数:7 被引量:26 H指数:3 供职机构: 大连理工大学信息检索研究室 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 国家教育部博士点基金 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
基于字符语言模型的垃圾邮件过滤 基于内容的过滤是当前解决垃圾邮件问题的主流技术之一。本文先简单综述了当前基于内容的垃圾邮件过滤中采用的各种技术,在此基础上提出将基于字符的语言模型应用于垃圾邮件过滤任务中,并通过实验对比了该方法与Nave Bayes、S... 苏绥 林鸿飞 叶正关键词:垃圾邮件过滤 语言模型 朴素贝叶斯 支撑向量机 N-GRAM 文献传递 基于标签共现的查询扩展研究 传统的查询扩展方法忽略了查询词与扩展词间的语义关联。随着Web 2.0的发展,folksonomy为网络提供了大量的社会化标注信息。作为folksonomy的核心,标签不仅可以高质量描述信息资源的内容和主题,并且标注相同... 晋松 林鸿飞 苏绥关键词:FOLKSONOMY 查询扩展 标签 共现 文献传递 基于字符语言模型的垃圾邮件过滤 被引量:9 2009年 基于内容的过滤是当前解决垃圾邮件问题的主流技术之一。该文先简单综述了当前基于内容的垃圾邮件过滤中采用的各种技术,在此基础上提出将基于字符的语言模型应用于垃圾邮件过滤任务中,并通过实验对比了该方法与Na ve Bayes、SVM和基于词的语言模型方法的性能差异,以及不同n值、不同特征选择方式对过滤结果的影响。实验结果表明,基于字符的语言模型实现简单且具有很高的性能,能较好地满足大规模在线邮件系统的需要,具有很高的实用价值。 苏绥 林鸿飞 叶正关键词:中文信息处理 垃圾邮件过滤 语言模型 朴素贝叶斯 支撑向量机 基于支持向量机的人物属性抽取 被引量:13 2007年 研究了如何使用机器学习方法和语义资源实现有效的人物属性抽取.人物属性抽取是指从自由文本中提取出人的属性信息,如性别、职务信息等.如果把描述人属性的词也看做是实体,则可以把人物属性抽取看作是实体关系抽取的具体应用.使用<知网>提取描述人属性的词作为触发词,这样就可以把触发词和人名间的描述关系转化为一分类问题.当选取触发词和人名左、中、右的3个词的词义和词性作为特征,使用支持向量机进行判别时达到最好抽取效果. 叶正 林鸿飞 苏绥 刘菁菁关键词:属性抽取 支持向量机 一种应用奇异值分解的RankBoost排序学习方法 Learning to rank(排序学习)已经成为当今信息检索领域研究和讨论热点。它运用信息检索和机器学习领域的方法,结合相关性判断条件提供与查询更加相关的信息。当前的排序算法主要集中于相关性标注数据的使用,本文通过对... 林原 林鸿飞 苏绥关键词:信息检索 奇异值分解 文献传递 基于支持向量机的人物属性抽取 研究了如何使用机器学习方法和语义资源实现有效的人物属性抽取.人物属性抽取是指从自由文本中提取出人的属性信息,如性别、职务信息等.如果把描述人属性的词也看做是实体,则可以把人物属性抽取看作是实体关系抽取的具体应用.使用<知... 叶正 林鸿飞 苏绥 刘菁菁关键词:支持向量机 文献传递 语言模型在信息检索中的应用 被引量:4 2011年 基于语言模型的检索方法为信息检索领域开辟了一个很有前景同时也具有相当挑战性的方向。与传统检索模型相比,语言模型不仅具有良好的理论基础,而且非常灵活,经过简单的变换很容易推演出其他经典的检索模型。此外,大量的实验结果表明,该方法的检索效果优于其他检索模型,因而一经提出便受到了广大研究人员的青睐。然而当前语言模型方法的研究主要集中在单语检索任务中,很少有研究关注语言模型方法在跨语言检索中的应用,针对这个问题,本文在系统介绍基于语言模型检索方法的基础上,将语言模型方法扩展到跨语言检索任务中,介绍了两个跨语言检索模型:统计翻译模型和跨语言相关语言模型。 苏绥 林原 林鸿飞关键词:统计语言模型 跨语言信息检索