吴苑斌
- 作品数:6 被引量:5H指数:2
- 供职机构:华东师范大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术医药卫生更多>>
- Text2 DT:面向临床诊疗文本的决策规则抽取技术被引量:2
- 2022年
- 为解决目前诊疗决策树构建依赖于耗时费力的专家注释的问题,提出一个全新的信息抽取任务——从临床诊疗文本中自动抽取诊疗决策树,并构建学界第1个从临床诊疗文本到诊疗决策树的数据集,为未来诊疗决策树的自动抽取奠定基础。
- 李文锋朱威王晓玲吴苑斌纪文迪汤步洲
- 关键词:自然语言处理信息抽取
- 基于小样本的金融事件抽取方法
- 本发明公开了一种基于小样本的金融事件抽取方法,根据实际需要确定金融事件和需要抽取的要素,包括触发词和若干事件论元,构建包括额外数据编码模块、要素分类器、语句重构模块、重构语句编码器、关系分类器和事件解码模块的事件要素抽取...
- 黄宇海邵旭曾文秋朱冰徐亮亮曹晓欢杜威刘燕婷吴苑斌王晓玲
- 基于标签增强和对比学习的鲁棒小样本事件检测被引量:3
- 2023年
- 小样本事件检测旨在通过少量样本进行事件检测。由于训练规模的限制,现有小样本事件检测系统存在稳定性和鲁棒性较差的问题。为了提高小样本事件检测的稳定性和鲁棒性,该文提出一个基于标签增强和对比学习的小样本学习算法。在原型网络的基础上通过模板引入事件标签表示作为模型先验来降低模型对于数据的敏感性,同时引入对比学习从高维空间上优化句子表示,提高模型的鲁棒性。相比于小样本事件检测的强基线系统,该文提出的模型在FewEvent数据集5-way-5-shot的情况下F_(1)值提高了4.7%,MAVEN数据集提高了9.2%。另外在数据中混有40%噪声的情况下,该文模型相较于其他强基线系统也有10%的增益,实验证明,该文所提模型在鲁棒性和稳定性明显提高的同时,性能也有显著提高。
- 高怡纪焘吴苑斌牟小峰王椗
- 一种基于形式语义推理和深度学习的自然语言知识挖掘方法
- 本发明公开了一种基于形式语义推理和深度学习的自然语言知识挖掘方法,包括以下步骤:机器学习步骤,用于将形式语义推理和机器学习方法相结合,并进行包含语义的机器学习;意图学习步骤,用于学习待挖掘的自然语言的描述意图;文本主题提...
- 史建琦吴双黄滟鸿王祥丰吴苑斌
- 文献传递
- 一种基于形式语义推理和深度学习的自然语言知识挖掘系统
- 本发明公开了一种基于形式语义推理和深度学习的自然语言知识挖掘系统,包括:机器学习模块,用于将形式语义推理和机器学习方法相结合,并进行包含语义的机器学习;意图学习模块,用于学习待挖掘的自然语言的描述意图;文本主题提取模块,...
- 史建琦吴双黄滟鸿王祥丰吴苑斌
- 文献传递
- 基于影响函数的远程监督关系抽取
- 2022年
- 远程监督的标注方法在关系抽取任务中被广泛应用,其在减小人工标注负担的同时,也引入了大量噪声样本,影响了模型的训练.针对这个问题,提出了一种基于影响函数的去噪方法.通过影响函数衡量训练集中每一条训练样本对模型预测的影响,并在建立噪声样本与其的关系后,设计了1个判断样本是否是错误标注的打分函数.基于此打分函数的值,从初始的1个小的无噪声集合出发,通过自举法迭代式地获得最后的去噪数据集.该去噪方法作为一种对数据的前处理方法,在公开数据集上取得了良好的效果.
- 黄子寅吴苑斌
- 关键词:关系抽取影响函数