您的位置: 专家智库 > >

付宇新

作品数:6 被引量:5H指数:1
供职机构:天津大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 2篇专利
  • 1篇学位论文

领域

  • 4篇自动化与计算...

主题

  • 3篇语义网
  • 3篇中文
  • 2篇知识抽取
  • 2篇知识组织
  • 2篇资源描述
  • 2篇资源描述框架
  • 2篇命名实体识别
  • 2篇百科
  • 2篇抽取
  • 2篇SPOTLI...
  • 1篇信息提取
  • 1篇知识
  • 1篇维基百科
  • 1篇关联数据
  • 1篇百科知识
  • 1篇NUTCH
  • 1篇RDF
  • 1篇SPARQL
  • 1篇BSP
  • 1篇表述性状态转...

机构

  • 6篇天津大学

作者

  • 6篇付宇新
  • 5篇冯志勇
  • 3篇王鑫
  • 2篇王鑫
  • 1篇饶国政
  • 1篇徐强

传媒

  • 1篇计算机研究与...
  • 1篇计算机工程与...
  • 1篇计算机科学与...

年份

  • 2篇2017
  • 2篇2015
  • 1篇2014
  • 1篇2013
6 条 记 录,以下是 1-6
排序方式:
面向语义网的中文百科知识组织与集成方法
本发明涉及知识抽取技术领域,为本发明的目的是按照语义网标准,提取、整理、发布和集成中文百科知识,为此,本发明采用的技术方案是,面向语义网的中文百科知识组织与集成方法,包括下列步骤:1)配置Nutch和Jingwei的环境...
付宇新冯志勇王鑫
文献传递
基于语义网的中文百科知识组织与集成被引量:4
2015年
通过从3个最大的中文百科全书(百度百科、互动百科、中文维基百科)所包含的大规模知识数据中识别重要的结构化特征生成RDF三元组,并将这些信息数据整合加入分布式大规模RDF数据存储系统,从而构成符合Linked Data要求的中文百科知识库RDF数据集。主要工作包括,通过配置网络爬虫对百度百科和互动百科的网页进行爬取,解析其中信息框等内容,生成RDF三元组并实现三元组的动态插入;下载需要的DBpedia中文三元组数据,将三元组进行整合并存储到课题组的大规模语义数据存储库Jingwei中;设计显示动态插入和三元组模式查询的页面,通过原型系统实验,验证了该方法的有效性。
付宇新王鑫冯志勇吕雪栋
关键词:语义网NUTCH
StepMatch:一种基于BSP计算模型的SPARQL基本图模式匹配算法
2013年
随着语义网的发展,越来越多的数据通过资源描述框架(resource description framework,RDF)格式发布出来.目前有很多研究使用MapReduce计算模型处理大规模RDF数据,将SPARQL查询拆分成多步迭代.对于更适合使用消息传递模型来解决的图计算问题,MapReduce并非是最佳的选择.StepMatch算法基于整体同步并行(bulk synchronous parallel,BSP)计算模型,能有效解决SPARQL的基本图模式匹配查询.StepMatch是一个面向顶点的算法,RDF图中每一个顶点都被视为一个计算单元,顶点可以执行计算并向其他顶点发送消息.对于一个给定的SPARQL查询,StepMatch算法的超步数量与SPARQL查询包含的子句数目相等.最后,实现了StepMatch算法,并在合成的LUBM(Lehigh University Benchmark)数据集和真实的DBpedia数据集上进行了性能实验.
吕雪栋冯志勇王鑫王鑫付宇新
关键词:资源描述框架SPARQL
面向语义网的中文百科知识组织与集成方法
本发明涉及知识抽取技术领域,为本发明的目的是按照语义网标准,提取、整理、发布和集成中文百科知识,为此,本发明采用的技术方案是,面向语义网的中文百科知识组织与集成方法,包括下列步骤:1)配置Nutch和Jingwei的环境...
付宇新冯志勇王鑫
DBpedia Spotlight上的命名实体识别优化被引量:1
2017年
命名实体识别任务能够搭建知识库与自然语言之间的桥梁,为关键字提取、机器翻译、主题检测与跟踪等研究工作提供支撑。通过对目前命名实体识别领域的相关研究进行分析,提出了一套通用的命名实体识别优化方案。首先,设计并实现了利用候选集的增量式扩展方法,降低了对训练集的依赖性;其次,通过点互信息率对实体上下文进行特征选择,大幅度降低了上下文空间,同时提高了标注性能;最后,提出了基于主题向量的二次消歧方法,进一步增强了标注准确率。通过在广泛使用的开源命名实体识别系统DBpedia Spotlight上进行多种比较实验,验证了所提优化方案与已有系统相比具有较优的性能指标。
付宇新王鑫冯志勇徐强
关键词:命名实体识别SPOTLIGHT
基于DBpedia Spotlight的高效命名实体识别方法研究
近些年,随着关联数据的发展,大量不同领域的知识库以RDF的形式发布出来,规模愈来愈大,内容愈来愈丰富。命名实体识别作为信息提取领域的子任务,能够构建知识库与自然语言文本之间的桥梁,利用知识库中的语义为关键字提取,机器翻译...
付宇新
关键词:命名实体识别关联数据信息提取
共1页<1>
聚类工具0