濮小佳 作品数:3 被引量:19 H指数:2 供职机构: 南京大学计算机科学与技术系计算机软件新技术国家重点实验室 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 国家社会科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
基于句法树结构的情感评价单元抽取算法 被引量:9 2011年 情感评价单元的抽取是情感分析的基础任务之一,目前大部分的抽取方法都基于句法路径等扁平化的特征,区分中文评价文本中噪声的能力不强。提出了一种基于短语句法的树型结构来表示情感评价单元模式,并使用近似卷积树核的方法来计算这种结构的相似度;在此基础上,采用基于相似度计算的模式匹配方法进行情感评价单元抽取。在中文商品评论上进行实验,该方法比基于句法路径的方法准确率提高了13.4%,召回率提高了9.2%。实验证明提出的方法对中文商品评价的情感评价单元抽取效果较好。 黄亿华 濮小佳 袁春风 武港山关键词:情感分析 句法树 相似度计算 基于重复模式的自动Web信息抽取 被引量:10 2008年 互联网上存在很多在线购物网站,抽取这类网站页面里的商品信息可以为电子商务、Web查询提供增值服务。该文针对这类网站提出一种自动的Web信息抽取方法,通过检测网页中的重复模式以及分析主题内容的特征获取网页的主题内容,该方法在抽取过程中不需要人工干预。对10个在线购物网站进行了测试,实验结果表明提出的方法是有效的。 胡仁龙 袁春风 武港山 濮小佳关键词:WEB信息抽取 DOM树 基于话题要素相似度计算的报道关系识别方法 2010年 报道关系识别是话题识别与跟踪TDT(Topic Detection and Tracking)研究内容中的基本任务之一,根据新闻话题的几大要素:时间、地点、人物、内容等,提出了一种基于话题要素的话题报道表示模型,并给出了基于话题要素相似度计算的报道关系识别方法。实验证明这种方法特别适用于同主题下不同话题的报道关系识别。 赵艳 戴播 濮小佳 袁春风关键词:话题识别与跟踪 相似度计算