孙展
- 作品数:2 被引量:1H指数:1
- 供职机构:上海交通大学电子信息与电气工程学院计算机科学与工程系更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 格式转换在基于仿人摘要系统中的应用
- 2004年
- 该文的主要内容是描述如何实现一个PDF格式转换模块,并添加到一个通用文档预处理模块结构中来增强系统功能。本预处理模块目前应用于一个新闻自动摘要系统。该系统采用了仿人算法,模拟人在处理摘要时候的思维模式,实现了一系列算法,最终生成了主题明确,反映中心,语句连贯的摘要。而PDF模块的加入,使得整个文档预处理模块的功能大大增强,能够处理文档的范围更加广泛,为进一步的文档信息处理打下了牢固的基础。该文详细分析了该格式的特点和数据存储方式,并提出了合适的解析算法。最后文章还讨论了如何利用设计模式来实现系统的无缝集成以及功能模块的动态添加,使得软件的模块化和可维护性得到了质的飞跃。
- 孙展王永成
- 关键词:软件维护
- 论文本的自动摘要被引量:1
- 2003年
- 自动摘要的研究是自然语言处理领域的一项重要且具有实践意义的工作,同时也是Internet信息处理的主要研究任务之一。本文叙述了自动摘要系统的历史和现状,并对它们做了归纳和总结。根据作者的观点,摘要大致可以分为五类;主题摘要、信息摘要、纲目摘要、摘录型摘要和评论型摘要。所采用的方法可分为下列七种:位置法、提示字串法、频率统计法、信息抽取法、框架法、理解分析法和仿人方法。
- 王永成刘功申刘传汉胡佩华孙展
- 关键词:自然语言处理信息处理