您的位置: 专家智库 > >

胡俊峰

作品数:14 被引量:69H指数:4
供职机构:北京大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字自然科学总论经济管理更多>>

文献类型

  • 8篇期刊文章
  • 4篇专利
  • 1篇学位论文
  • 1篇会议论文

领域

  • 8篇自动化与计算...
  • 3篇语言文字
  • 1篇经济管理
  • 1篇自然科学总论

主题

  • 6篇语料
  • 6篇语料库
  • 4篇文档
  • 3篇信息检索
  • 2篇信息地图
  • 2篇演示文档
  • 2篇用户
  • 2篇用户检索
  • 2篇知识
  • 2篇知识概念
  • 2篇宋诗
  • 2篇唐宋
  • 2篇唐宋诗
  • 2篇主文档
  • 2篇桌面
  • 2篇浏览
  • 2篇浏览器
  • 2篇网络
  • 2篇系统设计
  • 2篇客户端

机构

  • 14篇北京大学
  • 1篇东北大学
  • 1篇沈阳师范大学
  • 1篇中国标准化研...

作者

  • 14篇胡俊峰
  • 2篇邹小军
  • 2篇潘睿
  • 1篇黄志丹
  • 1篇吕学强
  • 1篇俞士汶
  • 1篇吴云芳
  • 1篇穗志方
  • 1篇任冠华
  • 1篇宋作燕
  • 1篇张乐
  • 1篇邱利坤
  • 1篇陈玉忠
  • 1篇陈蕾
  • 1篇周志

传媒

  • 4篇中文信息学报
  • 1篇中国标准化
  • 1篇北京大学学报...
  • 1篇复旦学报(自...
  • 1篇语言文字应用

年份

  • 1篇2020
  • 2篇2019
  • 1篇2018
  • 3篇2017
  • 2篇2015
  • 1篇2012
  • 1篇2004
  • 1篇2003
  • 2篇2001
14 条 记 录,以下是 1-10
排序方式:
一种基于领域本体的稿件—审阅人相关度度量方法被引量:1
2017年
随着稿件数量的不断增长,审阅人指派越来越成为会议组织者、期刊编辑和基金委员会的一项费时费力的工作,计算机辅助审阅人指派研究也由此得到了更多的关注。稿件—审阅人相关度度量是该研究中的一个重点问题。该文设计了一种基于领域本体的稿件—审阅人相关度度量方法。该方法由文档关键词提取、领域本体的自动构建及基于网络流模型的稿件—审阅人相关度计算等部分组成。初步实验表明,该方法在国家自然科学基金申请书申请代码分配的任务中取得较好表现,优于单纯基于关键词字串相似度的方法。
肖刘明镜周志邹小军胡俊峰
关键词:相似度计算领域本体信息检索
唐宋诗之计算机辅助深层研究被引量:25
2001年
介绍了北大计算语言学研究所开发的“唐宋诗计算机辅助研究系统”。该系统以全唐诗(481万字 )和宋代部分名家诗 (16 0万字 )组成的语料库为基础 ,运用计算语言学方法对唐宋诗进行分析研究 ,提取了唐宋诗中的词汇 ,计 5万余条目。在对诗文进行词语切分的基础上 ,建立了词汇的共现关系、对仗关系以及词汇的作者分布特征信息。系统除了提供面向诗文内容的全文检索功能外 ,还进一步开发了基于词汇的统计分析和诗句相似性检索等功能 。
胡俊峰俞士汶
关键词:语料库语言学计算语言学汉语信息处理
一种面向信息检索的信息地图生成方法及其动态更新方法
本发明公布一种面向信息检索的信息地图生成方法及其动态更新方法,通过对用户检索结果计算文档权重,根据文档权重进行数据可视化生成信息地图;并通过交互操作优化用户检索需求,动态调整并更新信息地图;具体包括:建立目标文档集合,构...
胡俊峰肖刘明镜潘睿
文献传递
基于Web的关联桌面演示子文档的在线演示文档编辑方法
本发明公布了一种基于Web的关联桌面演示子文档的在线演示文档编辑方法,该方法将用户指定的桌面演示文档的全部内容或部分页面关联入正在编辑的在线演示文档中,形成新的层次化树形结构的在线演示文档,包括在客户端浏览器中指定主文档...
胡俊峰成羽丰孙嘉裕
文献传递
基于多译文的中文转述语料库建设及转述评价方案被引量:4
2018年
转述语料是转述现象研究的基础。针对目前学术界中文转述语料稀缺的现状,该文以《简爱》的多个中文译本为基础,通过句对齐得到五万句级别的平行转述语料(1)。使用无监督的小句对齐和词对齐算法,从语料中挖掘到九千多对词汇转述知识。同时,还复现和改进了机器翻译测评指标Meteor,使得该指标更适合于中文转述句子的测评,并构造了一个中文句子转述测评数据集,以便对不同的转述知识和评价指标进行比较。实验表明,该文算法挖掘到的词汇转述知识在封闭测试中不逊于《同义词词林》。
阮翀施文娴李岩昊翁伊嘉胡俊峰
信息科学与技术领域术语部件描述被引量:18
2003年
术语的自动发现需要有语言知识的支撑。本文建立了“术语部件”的概念 ,通过考察 30 0 0 0条信息科学与技术领域的术语 ,提出了术语部件描述的方法与策略。术语部件主要采用属性描述的方法 ,本文提出了信息科学与技术领域术语部件属性设计的大致方案。术语部件描述是一种表层的、术语内部构成的语言知识描述。
吴云芳穗志方邱利坤宋作燕胡俊峰
关键词:信息科学
基于互联网产业社区分析的标准化体系研究被引量:2
2012年
随着信息化的深入,国民经济的各关键产业的信息及相关联系都可以在互联网上得到反映。如果能对互联网上海量数据进行采集和分析,必能对产业规律的发现和产业政策的制定提供重要辅助作用。本文提出了互联网产业社区的概念,并通过两个基本的产业社区发现算法,以水产领域为例,给出一个从产业社区的角度来辅助标准化体系研究的技术方案,同时在社会关注热点与标准化工作联系方面进行了探索。
胡俊峰邹小军陈玉忠任冠华
关键词:复杂网络
基于历时语料库的在线词典编纂系统设计被引量:1
2020年
语料库语言学是借助大规模语料库对语言现象进行发现、挖掘的学科,目前已经存在很多在线语料库辅助语言学的研究。该文提供了一个按时间分片进行管理的语料库,并基于此提出了一个由社区维护的在线词典编纂系统,该系统将语料库查询结果动态结合在被编辑的词条中。该文还介绍了一个多义词词义发现和层次化聚类算法,用以自动生成一个默认的词条框架。该文概述了词典编纂系统的总体情况,重点介绍系统的设计和使用方法。
吴先胡俊峰
关键词:词典编纂系统设计
一种面向信息检索的信息地图生成方法及其动态更新方法
本发明公布一种面向信息检索的信息地图生成方法及其动态更新方法,通过对用户检索结果计算文档权重,根据文档权重进行数据可视化生成信息地图;并通过交互操作优化用户检索需求,动态调整并更新信息地图;具体包括:建立目标文档集合,构...
胡俊峰肖刘明镜潘睿
文献传递
基于Web的关联桌面演示子文档的在线演示文档编辑方法
本发明公布了一种基于Web的关联桌面演示子文档的在线演示文档编辑方法,该方法将用户指定的桌面演示文档的全部内容或部分页面关联入正在编辑的在线演示文档中,形成新的层次化树形结构的在线演示文档,包括在客户端浏览器中指定主文档...
胡俊峰成羽丰孙嘉裕
共2页<12>
聚类工具0