苏劲松
- 作品数:61 被引量:63H指数:5
- 供职机构:厦门大学更多>>
- 发文基金:国家自然科学基金国家科技支撑计划国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于跨模态检索模型的检索方法及装置
- 本发明提出了一种基于跨模态检索模型的检索方法及装置,该方法包括获取第一跨模数据和对应的第二跨模数据,以便得到成对的训练数据集;建立跨模态检索模型,并采用训练数据集对跨模态检索模型进行训练,其中,跨模态检索模型包括多模态编...
- 苏劲松宋佳庄婉如林渝杰张亮
- 缓解语言对差异冲突的多语言机器翻译模型的训练方法
- 本发明提出了一种缓解语言对差异冲突的多语言机器翻译模型的训练方法,该方法包括:获取训练语料,其中,训练语料包括多个语言对;建立多语言机器翻译模型,并根据训练语料的每个语言对对多语言机器翻译模型进行训练;在训练过程中,计算...
- 苏劲松周楚伦刘鑫王鸿吉
- 一种基于内部语义层次结构的词嵌入表示方法
- 一种基于内部语义层次结构的词嵌入表示方法,涉及基于深度学习的自然语言处理。使用开源工具获得输入文本中每个词语的内部层次结构:该结构类似于传统短语树结构,不同的是以字符为基本单位,并且标注每个字符在该结构中的层次位置和类别...
- 苏劲松杨静阮志伟张祥文
- 基于快速自动密度聚类的可变尺度红外小目标的检测方法
- 基于快速自动密度聚类的可变尺度红外小目标的检测方法,涉及图像分析与图像理解。利用SURF算子解决尺度可变小目标的特征提取。解决特征对于环境的敏感问题;快速自动化密度聚类算法,针对问题域,直接从空域完成轨迹的分割、提取,克...
- 张海英苏劲松刘昆宏白皎刘岩李正洁朱宽赵曌
- 文献传递
- 基于统计抽词和格律的全宋词切分语料库建立被引量:16
- 2007年
- 全宋词切分语料库的建立是计算机研究宋词的基础。本文对宋词中“词”的界定提出了自己的看法,并在综合考虑统计抽词方法和基于诗词格律切分方法各自优点的基础上,提出建立全宋词切分语料库的新方法。我们首先通过统计抽词来抽取结合程度较强的二字词,并结合相关资源建立词表;在此基础上,结合宋词的格律特点按照一定的规则来对全宋词进行了切分。实验证明,本文中的方法具有较好的效果。
- 苏劲松周昌乐李翼鸿
- 关键词:中文信息处理宋词语料库格律
- 基于迭代式双向迁移的神经网络机器翻译模型
- 基于迭代式双向迁移的神经网络机器翻译模型,涉及自然语言处理。通过建立源领域和目标领域之间的多次双向迁移,利用双方的有效交互和相关知识的有益流动,不断完善不同领域的模型能力,从而达到更佳的翻译效果。由一对一的领域迁移推广到...
- 苏劲松曾嘉莉罗斌尹永竞王安特辛春蕾
- 文献传递
- 一种基于层次结构的神经网络机器翻译模型
- 一种基于层次结构的神经网络机器翻译模型,涉及基于深度学习的自然语言处理。使用词语对齐工具GIZA++对训练平行句对进行词对齐,然后根据标点符号和词语对齐信息将源语言句子分为单调翻译的子句;使用上述得到的子句数据来训练子句...
- 苏劲松曾嘉莉尹永竞
- 文献传递
- 一种基于结构化语义嵌入的图像内容自动描述方法
- 一种基于结构化语义嵌入的图像内容自动描述方法,涉及图像内容理解领域。包括以下步骤:获取文本解析树;构建视觉解析树;嵌入视觉解析树。通过对图像进行语义解析获得视觉语义结构树,获取关键的实体以及它们之间的关系,通过新的结构化...
- 纪荣嵘陈福海苏劲松
- 文献传递
- 基于图的双语递归自编码器
- 基于图的双语递归自编码器,涉及基于深度学习的自然语言处理。从平行语料中抽取双语短语作为训练数据,计算双语短语之间的翻译概率;基于枢轴语言的方法,计算复述概率;构造双语短语的语义关系图;基于双语短语的语义关系图;量化模型目...
- 苏劲松殷建民宋珍巧阮志伟
- 基于图的微博广告文本识别被引量:1
- 2017年
- 大量的微博广告影响了微博数据分析模型的使用.针对微博广告文本识别问题,利用基于图的半监督的标签传播算法,指导计算机从大量的非结构化的微博文本中自动识别出微博广告.通过对实验数据的评测,结果显示,当已有标签样本较少时,基于图的半监督的标签传播算法能够获得比有监督的支持向量机和朴素贝叶斯算法更好的性能.
- 罗斌唐红艳唐红艳秦悦苏劲松