林旭东
- 作品数:13 被引量:51H指数:4
- 供职机构:华南农业大学信息学院更多>>
- 发文基金:广东省科技攻关计划广州市科技攻关项目国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学医药卫生机械工程更多>>
- 基于词图的最大概率分词方法被引量:2
- 2008年
- 中文分词的方法主要可分为基于规则和基于统计两大类:前者一般借助于词图的方法,将分词问题转化为最优路径问题,通常切分结果不惟一;后者利用统计模型对语料库进行统计,计算量较大,但准确率较高。对词图和N元语法进行了介绍,并结合两者实现了一种中文分词方法。该方法将词图中的最大概率路径作为中文句子分词的结果,其中涉及对语料库进行二元词频统计,设计了一个多级哈希结构的分词词典,实验数据表明该方法能有效地进行自动分词。
- 刘汉兴朱梅阶刘财兴林旭东
- 关键词:中文分词词图二元语法
- 基于依存关系与支持向量机的中文问题分类方法被引量:2
- 2009年
- 提出依存关系规则与统计方法相结合,实现了基于依存关系与支持向量机的问题分类机制.实验结果表明,支持向量机结合依存关系的特征抽取方法,能获得较高问句分类正确率.
- 林旭东孙爱东林丕源刘汉兴
- 关键词:命名实体识别支持向量机
- 基于关键词聚类和节点距离的网页信息抽取被引量:11
- 2007年
- 大部分网页信息抽取方法都针对特定的网站,例如基于网站抽取规则和基于训练网页样例的方法。这些方法在某一个网站上可以很好地应用。但当遇到新的网站时,必须人为地增加抽取规则或者提供新的训练网页集。而且,当网站的模版改变时,也要重新设计这些规则或重新输入训练网页集。这些方法难以维护,因此不能应用到从大量不同的网站上进行信息抽取。本文提出了一种新的网页信息抽取方法,该方法基于特定主题的关键词组和节点距离,能够不加区分地对不同的网站页面信息自动抽取。对大量网站的网页进行信息抽取的实验显示,该方法能够不依赖网页的来源而正确和自动地抽取相关信息,并且已经成功应用到电子商务智能搜索和挖掘系统中。
- 邓健爽郑启伦彭宏林旭东
- 关键词:聚类信息抽取
- 医学信号检测仪器和远程信息共享系统软件的研究
- 该文基于远程虚拟仪器的设计思想和B/S(浏览器/服务器)模式结构进行了医学仪器软件的研究设计工作:基于远程虚拟仪器技术,研究并设计了多道生理参数检测仪的系统总体结构,采用全新的B/S模式结构.提供了更为简便灵活的数据查询...
- 林旭东
- 关键词:远程虚拟仪器加密技术串口通讯远程医疗
- 文献传递
- 基于本体的自动答疑系统的研究与实现被引量:11
- 2010年
- 针对现有自动答疑系统中知识表示的不足,提出了用本体构建课程领域知识库的方案。根据答疑问句的特点进行了问题分类,将用户问句意图转换为对本体中基本元素的查询,并通过Jena语句加以实现,最终抽取出答案,实验证明方案是可行的。
- 刘汉兴林旭东田绪红
- 关键词:本体自动答疑系统知识表示答案抽取
- 基于Web的中文开放式问题回答系统被引量:2
- 2006年
- 互联网正逐渐成为重要的信息资源,然而大多数搜索引擎不能处理自然语言提出的问题。基于互联网的中文问题回答系统由问题处理、信息检索、答案抽取和答案判断组成,利用命名实体识别、语义依存关系和案例规则模板实现答案抽取。实验表明:命名实体识别、语义依存关系和案例规则模板能有效地实现答案抽取,获得较高正确率。
- 林旭东彭宏郑启伦陈绍坚
- 关键词:命名实体识别信息抽取
- 计算机专业离散数学实验教学与实践
- 2011年
- 离散数学是计算机专业的理论基础课程,一般教学偏重理论而轻视实验教学环节,降低了计算机专业学生的学习兴趣与学习积极性。离散数学增加实验教学,有利于提高学生学习的主动性,有利于增强学生解决实际问题的实践能力,有利于培养学生的创新意识和创新能力。
- 林旭东朱梅阶刘汉兴
- 关键词:离散数学计算机专业实验教学
- 基于依存关系的问句理解与问句分类被引量:4
- 2007年
- 问句理解是问答系统的首要过程,问句分类是问句理解的主要组成部分,它在问答系统中具有非常重要的作用,因为问句类型有助于在文档中定位和抽取答案。问句分类的目标是基于预期的答案类型,准确地分类问句。本文提出依存关系规则与统计方法相结合,实现了基于依存关系的中文问句理解与问句分类机制。实验表明:支持向量机结合依存关系的特征抽取方法,获得了较高问句分类正确率。
- 林旭东彭宏林丕源邓健爽
- 关键词:问句分类命名实体识别
- 基于问句相似度的本体问答系统被引量:4
- 2010年
- 本体问答系统需要实现从自然语言问句到本体查询语句的转换,目前的解决方法主要有自然语言接口和问句相似度方法。针对现有问句相似度方法在本体问答系统中应用的不足,设计了改进的相似度计算方法。通过建立常问问题的查询模式集合,综合考虑问句的统计、语义、结构特征计算目标问句的相似度,分别以自动选择和用户交互两种方式选择目标问句的查询模式,并将其转换成实际SPARQL查询语句,最终检索本体及抽取出答案。两种方式的准确率分别为83.8%和92.1%。
- 刘汉兴刘财兴林旭东
- 关键词:问句相似度问答系统本体查询模式
- 基于Web的中文开放域问答系统研究
- 随着互联网的普及,互联网上的信息越来越多,为人们提供了丰富的信息资源。然而,人们却很难在杂乱无章的网络中快速、准确地获得自己想要的信息。虽然现在互联网上有很多搜索引擎可以帮助人们搜索自己想要的信息,但是目前的搜索引擎还有...
- 林旭东
- 关键词:中文人名识别信息检索系统命名实体识别答案抽取标注语料库问句处理
- 文献传递