杨燕燕
- 作品数:5 被引量:1H指数:1
- 供职机构:中国人民公安大学更多>>
- 发文基金:中国科学院战略性先导科技专项更多>>
- 相关领域:自动化与计算机技术政治法律更多>>
- 基于内存分析的计算机动态取证工具的设计与实现被引量:1
- 2013年
- 面对日益猖獗的计算机犯罪,计算机犯罪侦查、取证难,特别是一纵即逝的动态数据证据,影响了侦查办案的时机和对犯罪分子的定罪量刑。通过剖析Linux系统的内存结构,分析进程的活动情况,确定侦查线索和犯罪证据,并通过相关软件系统的设计与实现,可视化展示这些动态数据,为公安机关侦查办案人员提供有效的辅助办案工具。
- 杨燕燕魏丰国王斌君
- 关键词:取证工具GNOME
- 一种利用注意力增强卷积的暗网用户对齐方法
- 2023年
- 暗网用户在地下市场从事大量违法犯罪活动,暗网的匿名性给暗网用户之间的沟通交流带来了极大的便利,但也给执法人员带来了极大困难。近年来,深度神经网络在各个领域取得广泛成功,越来越多的研究者开始利用神经网络对匿名的网络文本作者进行身份识别。为了更好地进行暗网用户对齐,寻找更多同一身份的不同用户,笔者借用神经网络方法进行暗网用户身份识别和对齐。然而已有的方法主要面向短文本,不擅长处理全局和长序列信息。文中提出了一种自注意机制来增强卷积算子,利用长序列信息来建模暗网用户发表的网络文本的方法,从文本内容入手,对匿名的暗网用户进行多账号关联,达到聚合多个匿名账号信息的目的,为获取用户的真实身份提供更多线索。笔者在两个不同的暗网市场论坛进行全面评估,将提出的方法与当前最先进的技术进行了比较。结果表明提出的方法非常有效,在两个公开数据集上平均检索排名(MRR)分别提高约2.9%和3.6%,Recall@10分别提高约2.3%和3.0%。这项评估为该方法在暗网市场论坛中的有效性提供了强有力的证据。
- 杨燕燕杜彦辉刘洪梦赵佳鹏时金桥王学宾
- 关键词:卷积算子
- 暗网多平台用户身份对齐方法研究
- 杨燕燕
- 暗网网页用户身份信息聚合方法
- 2023年
- 暗网网页中用户身份标识信息的分布呈现出稀疏、不规律的特点,当前主流的信息聚合技术无法直接应用于该场景。提出一种基于共指关系抽取的用户身份信息聚合模型,该模型输入一对用户身份信息及其上下文语境,返回该信息对是否包含共指关系,并且构建相应的用户身份信息数据集用于聚合实验。为进一步提升模型的识别能力,在基线模型的基础上引入实体类别信息,提出实体类别敏感的共指关系抽取模型。针对暗网中通过某些身份类别信息无法获取足够多训练样本的问题,引入少样本学习任务,构建基于多任务的低资源条件下用户身份信息聚合模型。实验结果表明,在低资源条件下,经过优化的聚合模型F1值达到87.03%,较基线模型提升11.98个百分点。
- 王雨燕赵佳鹏时金桥申立艳刘洪梦杨燕燕
- 关键词:暗网信息聚合关系抽取多任务学习
- 基于原型网络的中文分类模型对抗样本生成
- 2023年
- 对抗样本生成通过在原文本中添加不易察觉的扰动使深度学习模型产生错误输出,常用于检测文本分类模型的鲁棒性。现有对抗样本生成方法多数采用黑盒或白盒攻击,在生成对抗样本的过程中需要和受害模型交互,且攻击效果依赖于受害模型的结构和性能,通用性较差。面向中文文本的对抗样本生成方法使用的变换策略过于单一,无法生成多样化的中文对抗样本。针对这些问题,提出一种基于原型网络的对抗样本生成(AEGP)方法。在全面分析汉字结构特点和人类阅读习惯的基础上,设计8种可保持语义一致的中文文本变换策略。将卷积神经网络作为编码器,构建原型网络,利用同一类别下的其他文本辅助发现所需变换的文本片段。针对选择的文本片段应用文本变换策略,生成对抗样本。实验结果表明,AEGP方法具有较好的通用性,能生成多样化的对抗样本,且相比于基线方法,分类模型在AEGP方法生成的对抗样本上的准确率下降了9.21~32.64个百分点。
- 杨燕燕谢明轩曹江峡王学宾柳厅文杜彦辉
- 关键词:文本表示