国家自然科学基金(61103067)
- 作品数:4 被引量:42H指数:2
- 相关作者:岳晓冬张志飞苗夺谦邱泉清聂建云更多>>
- 相关机构:同济大学上海大学蒙特利尔大学更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于粗糙集理论的协同训练算法被引量:1
- 2013年
- 为了提升风险决策环境下协同训练的效果,提出了一种基于粗糙子空间的协同决策算法。首先利用粗糙集属性约简的概念,将部分标记数据属性空间分解为两差异性较大的粗糙子空间;在各子空间上训练分类器,并依据各分类器决策风险代价及隶属度将无标记数据划分为可信、噪声和待定样本。综合两分类器的分类结果,标注少量可信无标记样本后重复协同训练。从理论上分析了算法性能提升的区间界,并在UCI数据集上进行实验,验证了模型的有效性及效率。
- 盛小春岳晓冬
- 关键词:属性约简粗糙集
- 中文微博命名实体识别被引量:33
- 2013年
- 微博这一媒体形式的迅速发展为命名实体识别提供了一个新的载体。根据微博文本的特点,提出针对中文微博的命名实体识别方法。首先,对微博文本做规范化处理,消除由于微博表达不规范造成的干扰;在建立中文人名库、常用地点库等知识库的基础上,选取适合微博的特征模板,使用条件随机场方法进行实体识别;同时,将正确的识别结果添加到知识库中以提升识别效果。在真实微博数据上的实验表明,该方法能够有效地完成中文微博的命名实体识别任务。
- 邱泉清苗夺谦张志飞
- 关键词:中文信息处理条件随机场
- 强语义模糊性词语的情感分析被引量:7
- 2015年
- 语义的模糊性给词语的情感分析带来了挑战。有些情感词语不仅使用频率高,而且语义模糊性强。如何消除语义模糊性成为词语情感分析中亟待解决的问题。该文提出了一种规则和统计相结合的框架来分析具有强语义模糊性词语的情感倾向。该框架根据词语的相邻信息获取有效的特征,利用粗糙集的属性约简方法生成决策规则,对于规则无法识别的情况,再利用贝叶斯分类器消除语义模糊性。该文以强语义模糊性词语"好"为例,对提出的框架在多个语料上进行实验,结果表明该框架可以有效消除"好"的语义模糊性以改进情感分析的效果。
- 张志飞苗夺谦岳晓冬聂建云
- 关键词:情感分析语义模糊性粗糙集贝叶斯分类