宋晖 作品数:33 被引量:64 H指数:4 供职机构: 东华大学计算机科学与技术学院 更多>> 发文基金: 国家自然科学基金 上海市自然科学基金 中央高校基本科研业务费专项资金 更多>> 相关领域: 自动化与计算机技术 文化科学 电气工程 经济管理 更多>>
大学计算机基础类数据科学课程的探索与实践 被引量:4 2019年 针对大学本科生具备的知识背景,抽取数据科学工作的思想和方法,结合大数据、人工智能应用等前沿技术,提出计算机基础教学体系中数据科学课程的知识结构框架,探讨适应性的教学内容、教学方法和实验体系,最后说明教学实践效果. 宋晖 刘晓强 杜明 王洪亚关键词:计算机基础教学 教学内容 人工智能 面向新工科建设的计算机通识教育探索 2023年 新工科建设以互联网和工业智能为核心,是卓越工程师教育培养计划2.0的主要抓手。高校人才培养应主动适应未来产业数字化和智能化趋势,解决信息前沿基础知识的全面覆盖问题。针对新工科建设的需求,探索计算机通识教育一体化人才培养体系,着力开展学科交叉融合、项目式教育教学设计、资源数字化和教育信息化等多方面实践。搭建开放教学平台,支撑线上线下混合式教学、人工智能实训和学科竞赛,全面提升学生创新能力和解决复杂问题的能力,为高校通识教育改革提供参考借鉴。 尹枫 宋晖 刘晓强关键词:PBL教学 基于文本的安全过滤研究 2009年 研究比较了文本检索与安全过滤的异同,以文本过滤为手段,借鉴文本检索的一些方法,在安全过滤环境中,正例文本和反例文本的特征向量非常相似的情况下,提出了一种有效的算法,过滤掉会对社会造成危害的非法网页。 杨敏 宋晖关键词:文本过滤 信息增益 贝叶斯分类 基于WBEM标准的Web应用监控系统的研究与实践 Web应用监控有别于传统的网络监控,它着重从Web应用本身的结构出发,对Web应用在使用过程中的性能及状态进行有效的监控,强调对Web应用在使用过程中的性能及状态进行有效的监控。本文主要提出了以CIM模型为基础的Web应... 李佳俊 宋晖关键词:CIM WBEM WEB 文献传递 面向电力领域自然语言理解的数据增强研究与实现 2023年 探究面向领域智能问答中自然语言理解的数据增强问题。由于应用缺乏历史数据,且人工标注成本高,无法满足大规模训练自然语言理解模型的需求。因此,对传统数据增强的方法进行研究,提出使用基于对比搜索的关键字文本生成模型,以此生成了具有句式表达多样性的的数据集。实验结果表明,相比传统的集中搜索算法,使用对比搜索作为模型的解码策略能够生成更加准确和合理的电力领域问题文本,有效地降低了生成文本的词重复率。利用这些样本数据,成功地训练了一个高效准确的自然语言理解模型,提高了用户意图识别的准确率。这一研究对于智能问答领域的实际应用具有一定的参考价值。 施俊威 宋晖关键词:自然语言理解 基于BERT的端到端中文篇章事件抽取 被引量:2 2022年 篇章级事件抽取研究从整篇文档中检测事件,识别出事件包含的元素并赋予每个元素特定的角色。该文针对限定领域的中文文档提出了基于BERT的端到端模型,在模型的元素和角色识别中依次引入前序层输出的事件类型以及实体嵌入表示,增强文本的事件、元素和角色关联表示,提高篇章中各事件所属元素的识别精度。在此基础上利用标题信息和事件五元组的嵌入式表示,实现主从事件的划分及元素融合。实验证明,该文提出的方法与现有工作相比具有明显的性能提升。 张洪宽 宋晖 徐波 王舒怡关键词:端到端 纬编针织物在计算机中的三维仿真 被引量:21 2011年 为真实模拟纬编针织物的结构,通过分析纬编针织物的物理模型,在三维Pierce线圈模型基础上,引入B样条及椭圆描述线圈,从而建立三维几何线圈模型.根据纱线线圈的中心线走向,将线圈分为两个部分:弧段和圈柱,弧段(如针编弧、沉降弧)用椭圆描述,圈柱用三次B样条曲线模拟.最后利用OpenGL结合VC++模拟针织物的结构,并实现光照效果.试验结果表明:采用该模型及实现方法,模拟效果比单独采用三维Pierce模型、B样条模型更加逼真. 吴周镜 宋晖 李柏岩 刘晓强 王府梅关键词:纬编针织物 B样条曲线 OPENGL 光照 一种基于异构网络算法的药物-蛋白关联性研究方法 2019年 药物与蛋白质间关联性的研究,有助于药物的重新定位和发现药物新的使用途径,是网络药理学的重要研究内容。应用现有网络随机游走算法预测药物与蛋白质间新的关联时,一般直接在药物-蛋白质二分图网络内进行随机游走,并且不断重复此过程,这种方法效率很低,还会遗漏药物-药物相似性网络和蛋白-蛋白相似性网络中部分拓扑信息。鉴于此,本文提出一种异构网络异步重启随机游走算法(Drug Restart Walk Random Prediction,DRWRP),构建药物-蛋白质异构网络,深层次挖掘二者间潜在的关联性。该算法分别在药物相似性网络、蛋白质相似性网络以及药物-蛋白质二分图网络中进行随机游走,然后在网络间不停跳转,反复迭代后形成稳态概率向量,最终得到潜在最优关联。仿真实验表明,本文提出的算法可以有效预测药物与蛋白质间新的关联,多数预测结果获得了文献证据支持。 徐婷 龚家瑜 宋晖关键词:异构网络 基于企业服务总线(ESB)的企业应用集成平台研究 当前企业应用不断聚合跨越不同技术领域、地理界限、组织界限的服务,企业服务总线越来越多地应用于企业应用集成平台中.本文对企业服务总线的体系结构和功能模型进行了描述,并提出了一种基于企业服务总线的服务网关集成平台模型. 王秀春 宋晖关键词:企业服务总线 企业应用集成平台 服务网关 文献传递 移动轨迹数据去匿名化攻击方法 被引量:3 2016年 为保护移动对象轨迹隐私,轨迹数据集发布前常使用假名对轨迹进行匿名化处理。然而,假名用户的匿名轨迹仍面临隐私泄露风险。为此,提出一种新的去匿名化攻击方法。攻击者若获得其攻击对象当前或未来任意时段的若干轨迹片段,则可以此比对匿名历史轨迹数据集,从中识别出攻击对象的历史轨迹。对2组真实移动轨迹数据进行特征分析,给出基于轨迹特征相似度的去匿名方法。采用改进的词频-逆文档频率方法提取历史轨迹的特征向量,通过主成分分析降维后,对历史轨迹和攻击者所获得的轨迹片段进行特征匹配,识别出与攻击者所持有轨迹特征相似度最高的历史轨迹。实验结果表明,所提方法可获得较高的去匿名准确率。 钟建友 常姗 刘晓强 宋晖关键词:假名 特征提取