教育部人文社会科学研究基金(12YJCZH121)
- 作品数:3 被引量:43H指数:3
- 相关作者:陈小荷梁社会曲维光马创新刘浏更多>>
- 相关机构:南京师范大学更多>>
- 发文基金:教育部人文社会科学研究基金江苏省教育厅哲学社会科学基金江苏高校优势学科建设工程资助项目更多>>
- 相关领域:文化科学语言文字自动化与计算机技术更多>>
- 中文古籍数字化的开发层次和发展趋势被引量:21
- 2014年
- 文章根据数字化加工深度对中文古籍数字化进行了层次划分,分析了表层数字化与深层数字化之间的区别,指出了古籍数字化的发展趋势。
- 马创新曲维光陈小荷
- 关键词:古籍数字化
- 先秦文献《孟子》自动分词方法研究被引量:18
- 2013年
- 自动分词是中文信息处理重要的基础课题。文章主要探讨了先秦文献《孟子》基于条件随机场统计模型的自动分词方法和利用相关注疏文献的自动分词方法等自动分词技术。自动分词实验结果表明,这两种分词方法效果显著,词语F值和小句F值均达到了较高的水平。在用不同的方法对《孟子》进行自动分词时,在词语F值的统计指标外,首次尝试引入了小句F值这一统计指标。
- 梁社会陈小荷
- 关键词:自动分词条件随机场
- 先秦汉语排比句自动识别研究--以《孟子》《论语》中的排比句自动识别为例被引量:6
- 2013年
- 《论语》、《孟子》等先秦汉语文献对后世影响深远,其中大量使用的排比句,使这些文献有极强的说服力,增强了表达效果。以《孟子》、《论语》中的排比句的自动识别为例,探讨了古代汉语修辞格的自动识别。详细分析先秦汉语排比句的特点,并设计了相应的自动识别算法,来分别处理《孟子》和《论语》中的排比句,并对自动识别结果进行了分析和比较。在处理《孟子》、《论语》这两种风格不太相同的先秦文献时,排比句自动识别算法都保持了较好的性能。
- 梁社会陈小荷刘浏
- 关键词:信息处理先秦汉语排比句自动识别