钱揖丽
- 作品数:32 被引量:97H指数:7
- 供职机构:山西大学计算机与信息技术学院更多>>
- 发文基金:国家自然科学基金山西省自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学自然科学总论语言文字更多>>
- 基于句法依存和条件随机场的韵律短语识别
- 2019年
- 正确划分句子的韵律结构对于提高合成语音的质量具有重要的意义。特征的选择是韵律结构预测的关键因素之一。在中文信息处理中,文本特征可以分为浅层文本特征与深层文本特征。浅层特征包括词、词性、词长等;深层特征包括句法信息、语义信息等。该文在挖掘剖析句法结构、依存句法结构同韵律结构之间关系的基础上,从文本中获取相关浅层和深层文本特征,并采用条件随机场模型实现韵律短语预测。首先以浅层文本特征进行韵律短语识别,然后在此基础上加入句法依存深层文本特征进行模型构建。实验结果表明:加入句法依存特征后,韵律短语预测精确率提高了13.3%,召回率提高了14.69%,F值提高了14.1%。
- 钱揖丽张二萌
- 关键词:文本特征条件随机场
- 新工科背景下基于OBE理念的计算机组成原理课程教学改革
- 2021年
- 为了提升课程教学效率,文章从课程重组与大纲修订、教学方法的改革与创新、教学质量评价体系的构建与完善三个方面阐述了新工科背景下基于OBE理念的计算机组成原理课程教学改革。
- 钱揖丽关晓蔷
- 应用二叉树剪枝识别韵律短语边界被引量:4
- 2006年
- 句子的韵律短语识别是语音合成的重要研究内容。本文提出了应用统计语言模型生成的二叉树,结合最大熵方法识别待合成汉语句子的语音停顿点。文中给出了二叉树相关的模型训练和生成算法;二叉树与语音停顿点之间的关系;在最大熵方法中应用二叉树剪枝识别句子的韵律短语。实验结果表明,在搜索算法中,利用二叉树进行剪枝,可以很大程度上提高语音停顿预测的正确率和召回率,基于试验数据的f-Score提高了近35%。
- 荀恩东钱揖丽郭庆宋柔
- 关键词:统计语言模型二叉树韵律短语最大熵
- 基于标点信息和统计语言模型的语音停顿预测被引量:8
- 2008年
- 语音停顿被认为是有声语言的标点符号.在语言交流中,说话人会在韵律短语的边界处插入长短不同的停顿.利用这一性质,在调查标点符号停顿作用的基础上,提出基于标点信息预测语音停顿的思想,阐述基于标点和统计模型的训练语料自动获取以及语音停顿预测方法,讨论训练语料规模对模型性能的影响,并比较基于标点信息的自动获取语料与人工标注语料的性能.实验结果显示,汉语的标点提供有价值的停顿信息,基于汉语标点信息能够有效预测语音停顿.
- 钱揖丽荀恩东
- 关键词:标点符号语音停顿统计语言模型
- 基于CFN和篇章主题的概括型问答题的解答被引量:3
- 2020年
- 相对于普通阅读理解,高考语文阅读理解难度更大,问句更加抽象,答案候选句的抽取除了注重与问句的相似性分析,还注重对材料内容以及作者的观点的概括归纳。因此该文提出了利用汉语框架网(Chinese FrameNet)抽取与问句语义相似的候选句的方法,通过识别篇章主题(段落主题句和作者观点句),生成与问句相关的内容要点以及作者的观点态度,最终选取top 6作为答案句。在近12年北京市高考真题上进行测试,召回率达到了68.69%,验证了该方法的有效性。
- 杨陟卓李春转张虎钱揖丽李茹
- 关键词:框架语义
- 二字词词义组合推理方法的研究被引量:9
- 2001年
- 汉字是表义文字 ,具有丰富的语义内容 ,汉字是一个有限的封闭集 ,它的数目是有限的 ,而汉语的词是一个开放系统 ,它是无限的。本文以“字义基元化、词义组合化”为基本思想 ,从字义着手 ,研究二字词词义组合。首先以经过整理的《现代汉语规范字典》、《现代汉语词典》和《同义词词林》为资源 ,从中自动搜索、抽取出二字词词义组合 ,建立汉字字义、词义知识库 ,然后再采用《同义词词林》的语义体系 ,通过语义相关度等的计算确定它们的组合类型 。
- 郑家恒钱揖丽李竞
- 关键词:语义相关度词汇学汉语知识库语义结构
- 一种阅读机器人进行自动问答的系统及其应用方法
- 本发明公开了阅读机器人进行自动问答的方法及系统,包括有题型分析模块、词语相似度匹配模块、段落主题句和作者观点句抽取模块以及答案句抽取模块,本发明首次提出根据概括性问答题特征,然后进行线性插值的方法来分析问题类型,有效地填...
- 杨陟卓李春转张虎钱揖丽李茹
- 文献传递
- 一种阅读机器人进行自动问答的系统及其应用方法
- 本发明公开了阅读机器人进行自动问答的方法及系统,包括有题型分析模块、词语相似度匹配模块、段落主题句和作者观点句抽取模块以及答案句抽取模块,本发明首次提出根据概括性问答题特征,然后进行线性插值的方法来分析问题类型,有效地填...
- 杨陟卓李春转张虎钱揖丽李茹
- 文献传递
- 利用AdaBoost-SVM集成算法和语块信息的韵律短语识别被引量:2
- 2015年
- 提出一种基于汉语语块结构并利用AdaBoost-SVM集成学习算法的汉语韵律短语识别方法。首先,对语料进行自动分词、词性标注和初语块标注,然后基于结合紧密度获取语块归并规则并利用规则对初语块进行归并,得到最终的语块结构。其次,基于语块结构并利用AdaBoost-SVM集成算法,构建汉语韵律短语识别模型。同时,该文利用多种算法分别构建了利用语块信息和不利用语块的多个模型,对比实验结果表明,表示浅层句法信息的语块能够在韵律短语识别中做出积极有效的贡献;利用AdaBoos-SVM集成算法实现的模型性能更佳。
- 钱揖丽冯志茹
- 关键词:韵律短语
- 高考语文阅读理解自动答题系统
- 2022年
- 机器阅读理解任务需要机器理解篇章并回答相关问题,是许多应用系统中的一项核心任务。该文面向高考语文中的现代文阅读理解文本语义表示、候选句抽取、鉴赏分析等关键技术展开研究,针对选择题、问答题等构建了相应的答题引擎,并在高考真题及测试题上,对系统进行了实验验证与错误分析,实验结果表明,该文所构建的系统能够在一定程度上解答问题。未来将围绕语义表示、知识的统一表征与知识聚合、迁移学习等前沿技术,提升阅读理解系统的复杂综合推理能力、概括分析能力、语言鉴赏能力。
- 谭红叶郭少茹陈鑫王素格李茹张虎杨陟卓陈千钱揖丽王元龙关勇吕国英
- 关键词:高考语文