刁宇峰
- 作品数:11 被引量:34H指数:2
- 供职机构:大连理工大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金教育部留学回国人员科研启动基金更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 一种基于语义资源词表示和搭配关系的语义双关语识别方法
- 一种基于语义资源词表示和搭配关系的语义双关语识别方法,属于自然语言处理领域,用于解决双关语识别问题。识别方法包括:S1预处理语义双关语语料;S2构建基于语义资源词表示模型;S3使用Bi‑LSTM识别语义双关语;S4构建基...
- 林鸿飞刁宇峰杨亮樊小超申晨吴迪许侃
- 文献传递
- 双关语识别与生成关键技术研究
- 双关语是一种用来描述和理解词义歧义的修辞表达,主要通过词的多重含义或者同音近音的方式,从而使得双关语在上下文语境中具有双重含义,其语言表达更为含蓄、幽默。双关语不但是一种语言学的修辞现象,也是一种隐式情感表达方式,具有独...
- 刁宇峰
- 关键词:自然语言处理
- 文献传递
- 基于LDA模型的博客垃圾评论发现被引量:25
- 2011年
- Blog(博客)作为一种新兴的网络媒体,在很大程度上增强了互联网的开放性,Blog已经成为互联网上的主要信息源之一,这也使得Blog空间中的垃圾评论成倍增长,因此如何识别垃圾评论成为面临的重要问题。该文首先借鉴处理垃圾邮件的方法,针对Blog本身的特点,使用规则初步过滤垃圾评论,然后对剩余评论,利用Latent Dirichlet Allocation(LDA)这种能够提取文本隐含主题的产生式模型,对博客中的博文进行主题提取,并结合主题信息进行判断,从而识别Blog空间的垃圾评论。通过实验验证,该方法可以发现大多数垃圾评论,实验取得了较好的结果,使Blog信息更加准确、有效的为用户使用。
- 刁宇峰杨亮林鸿飞
- 关键词:BLOG博文LDA主题垃圾评论
- 基于博客的作者声誉度分析
- 随着Web2.0的发展,众多基于Web2.0的应用平台也迅猛的发展起来,其中Blog就是主要代表传播平台之一。众所周知,Blog这种自由、发散和随意性的特点也使得它日渐成为舆情产生和传播的主要场所,所以,对Blog中发布...
- 刁宇峰
- 关键词:BLOG垃圾评论
- 文献传递
- 基于ECPA神经网络的情绪原因识别方法
- 情绪原因识别是文本情绪分析领域中一个前沿的研究方向.传统情绪原因识别方法需要进行制定规则、特征抽取等过程,而本文从情绪原因的语言特点出发,结合Bi-LSTM模型和注意力机制,提出一种基于情绪上下文位置注意力神经网络的情绪...
- 刁宇峰杨亮樊小超吴迪任璐张冬瑜许侃林鸿飞
- 关键词:情绪信息位置信息
- 博客作者声誉度分析被引量:2
- 2013年
- 博客作为一种新兴的网络媒体,它具有自媒体的特征,使其成为舆情产生和传播的主要场所,因此对于博客作者和评论的研究是十分重要的。传统的博客作者声誉度排名是基于点击率和评论数量进行的,在此基础上结合评论的质量和博文的内容实现了对博客作者声誉度的排名。首先通过情感语义特征分析博文,获得博客的情感基调;然后利用基于段落的多句联合评估方法进行评价;最后结合得到的评论倾向性和质量及浏览量等信息获得作者的声誉度。实验结果表明,该方法可以更为有效地对博客作者的声誉度进行排名。
- 杨亮许侃林鸿飞王健刁宇峰
- 基于潜在语义特性的语义双关语检测及双关词定位
- 语义双关语是幽默、笑话和喜剧等作品的来源之一,在人类写作的发展进程中具有重要的历史地位.由于语义双关语存在歧义难懂的特点,因此难以挖掘语义双关语的潜在语义信息,故目前语义双关语的检测和双关词的定位是自然语言处理任务中的一...
- 刁宇峰杨亮樊小超吴迪徐博许侃林鸿飞
- 关键词:同义词
- 一种基于神经网络和幽默特征的幽默识别方法
- 一种基于神经网络和幽默特征的幽默识别方法,属于数据挖掘和自然语言处理领域,用以解决进行幽默识别的问题,要点是包括S1、幽默语料采集及预处理;S2、幽默特征提取;S3、文本的词向量表示;S4、神经网络模型构建;S5、幽默识...
- 林鸿飞樊小超杨亮刁宇峰申晨楚永贺任璐张桐瑄
- 文献传递
- 一种基于语义资源词表示和搭配关系的语义双关语识别方法
- 一种基于语义资源词表示和搭配关系的语义双关语识别方法,属于自然语言处理领域,用于解决双关语识别问题。识别方法包括:S1预处理语义双关语语料;S2构建基于语义资源词表示模型;S3使用Bi‑LSTM识别语义双关语;S4构建基...
- 林鸿飞刁宇峰杨亮樊小超申晨吴迪许侃
- 文献传递
- 基于BERT-SUMOPN模型的抽取-生成式文本自动摘要被引量:9
- 2021年
- 可读性、准确性较差,生成式摘要存在连贯性、逻辑性的不足,此外2种摘要方法的传统模型对文本的向量表示往往不够充分、准确。针对以上问题,该文提出了一种基于BERT-SUMOPN模型的抽取-生成式摘要方法。模型通过BERT预训练语言模型获取文本向量,然后利用抽取式结构化摘要模型抽取文本中的关键句子,最后将得到的关键句子输入到生成式指针生成网络中,通过EAC损失函数对模型进行端到端训练,结合coverage机制减少生成重复,获取摘要结果。实验结果表明,BERT-SUMOPN模型在BIGPATENT专利数据集上取得了很好的效果,ROUGE-1和ROUGE-2指标分别提升了3.3%和2.5%。
- 谭金源刁宇峰杨亮祁瑞华林鸿飞