吴华
- 作品数:4 被引量:31H指数:3
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信语言文字更多>>
- 问答篇章生成系统中的用户模型和文本规划被引量:7
- 2001年
- 在问答生成系统中 ,如果系统首先了解用户对问题所涉及的领域知识的掌握程度 ,系统则能根据这些知识组织文本 ,生成符合用户需要的内容 ,更好地进行人机交互。本文以花卉知识查询系统为基础 ,探索了用户知识对生成结果的影响 ,以及用户模型与文本规划之间的相互作用。实验结果表明 :用户知识模型不但影响生成的内容 ,而且影响生成内容的风格。在此系统中 ,我们采取两种基本生成策略 :Schema方法和Process方法 。
- 吴华黄泰翼
- 关键词:用户模型文本规划汉语生成自然语言处理
- 汉语篇章生成系统中的用户模型和文本规划
- 文本规划是篇章生成的一个不可或缺的组成部分,它的主要作用是确定所要生成的内容以及生成内容之间的逻辑关系,而规划的内容又受到用户模型的影响.因此,本文首先建立了用户模型,并根据用户模型采用了Schema方法和Process...
- 吴华黄泰翼
- 关键词:用户模型文本规划汉语生成
- 汉语自然语言生成的理论、方法的研究及系统实现
- 该文对汉语自然语言生成的理论、方法,特别是独立于应用领域的句法实现及文本规划方法进行了全面和深入的研究,提出了通用的汉语生成系统的框架.在此基础上,成功地设计并实现了一个应用于口语翻译的生成系统和一个用于信息查询的汉语篇...
- 吴华
- 关键词:句法实现文本规划
- 文献传递
- 基于三音子模型的语料自动选择算法被引量:20
- 2000年
- 在语音识别中 ,如何经济地挑选语音训练语料 ,使其覆盖尽可能多的语音现象是一个非常重要的问题 .传统的语音训练语料采用手工挑选后再进行检验和补充的方法 ,此方法难以保证所选语料语音现象的覆盖率 .该文提出了一种自动地从大规模语料库中挑选语料的搜索算法 ,此算法不但能使所选语料覆盖几乎所有语音现象 ,而且能保证训练语料中三音子和类三音子有足够的样本个数 ,使训练数据不过于稀疏 ,为训练正确而可靠的语音模型打下了坚实的基础 .
- 吴华徐波黄泰翼
- 关键词:语音识别三音子模型