搜索到1099篇“ 《越狱》“的相关文章
一种监狱防越狱预警装置及其配套使用的安防电网
本发明公开了一种监狱防越狱预警装置及其配套使用的安防电网,涉及监狱安防技术领域。本发明包括安装于墙头的检测单元,其中检测单元用于检测是否有犯人接近墙头,并且检测单元电性连接有控制单元。本发明通过设置防越辊阻止犯人逃脱,该...
袁国栋李顺平程国房
用于中文大模型的越狱攻击方法及装置、电子设备
本申请涉及生成式大模型技术领域,公开一种用于中文大模型的越狱攻击方法,包括:对待输入的攻击问题进行数据增强;将增强后的攻击问题与经过选择的攻击模板进行拼接;将拼接后的数据作为测试模型的输入,对测试模型进行攻击,获得测试模...
陈文弢黑一鸣石霖陈杰
一种大模型越狱攻击检测方法
本申请涉及一种大模型越狱攻击检测方法,该方法包括:S1:基于混合专家模型和Transformer架构构建越狱攻击检测模型,越狱攻击检测模型包括多层MoE‑Transformer结构,并采用正无标记学习方法训练越狱攻击检测...
胡为民袁吉郑喜谢丽慧
越狱”神龟
2024年
我家的两只小乌龟汤小尖和汤小圆又“越狱”了。其实,它俩早就已经是“惯犯”了,在这一-“行当”里,它俩绝对是高手。不过,依我之见,汤小尖才是“主谋”,汤小圆最多只能算个被动的“帮凶”每次“越狱”事件几乎都是这样开始的:汤小圆正趴在龟盒的小“山坡”顶懒洋洋地享受日光浴。
汤桢吉
关键词:神龟越狱
面向大语言模型的越狱攻击综述被引量:3
2024年
近年来,大语言模型(large language model,LLM)在一系列下游任务中得到了广泛应用,并在多个领域表现出了卓越的文本理解、生成与推理能力.然而,越狱攻击正成为大语言模型的新兴威胁.越狱攻击能够绕过大语言模型的安全机制,削弱价值观对齐的影响,诱使经过对齐的大语言模型产生有害输出.越狱攻击带来的滥用、劫持、泄露等问题已对基于大语言模型的对话系统与应用程序造成了严重威胁.对近年的越狱攻击研究进行了系统梳理,并基于攻击原理将其分为基于人工设计的攻击、基于模型生成的攻击与基于对抗性优化的攻击3类.详细总结了相关研究的基本原理、实施方法与研究结论,全面回顾了大语言模型越狱攻击的发展历程,为后续的研究提供了有效参考.对现有的安全措施进行了简略回顾,从内部防御与外部防御2个角度介绍了能够缓解越狱攻击并提高大语言模型生成内容安全性的相关技术,并对不同方法的利弊进行了罗列与比较.在上述工作的基础上,对大语言模型越狱攻击领域的现存问题与前沿方向进行探讨,并结合多模态、模型编辑、多智能体等方向进行研究展望.
李南丁益东江浩宇牛佳飞易平
关键词:自然语言处理网络空间安全
面向大语言模型的越狱攻击与防御综述
2024年
大语言模型(LargeLanguageModels,LLMs)由于其出色的性能表现而在各个领域被广泛使用,但是它们在面对精心构建的越狱提示时,往往会输出不正确的内容,由此引发了人们对其伦理问题和道德安全的担忧。攻击者可以在没有了解模型内部结构及安全机制的情况下,通过设计特定的提示语句引发模型生成不恰当的内容。相关领域的专业研究者在分析LLMs的潜在脆弱性后,甚至可以产生人类难以发现,并且越狱成功率极高的自动化越狱攻击方法。为了阻止LLMs的恶意越狱攻击,研究者们提出覆盖LLMs训练到部署全生命周期的防御方法以加强模型的安全性。然而,目前对于大语言模型的综述工作主要集中在越狱攻击方法,并且没有对这些技术手段的特性及关系进行详细分析。此外,对评测基准总结的忽视也限制了该领域的蓬勃发展。因此,本文拟对现有的越狱攻击与防御方法进行全面的回顾。具体而言,我们首先介绍了大语言模型与越狱攻击的相关概念及原理,解释了越狱攻击在模型安全领域的重要性和它对大型语言模型的潜在威胁。接着,从攻击的生成策略回顾了现有的越狱攻击方法,并分析了他们的优缺点,如这些攻击策略如何利用模型的漏洞来实现攻击目标。然后,本文总结了围绕LLMs各个阶段的防御策略,并提供了一个全面的评测基准,详细介绍了如何评估这些防御策略的有效性。最后结合当前面临的挑战,我们对LLMs越狱攻防的未来研究方向进行了总结和展望,指出了未来研究中需要关注的关键问题和潜在的研究方向,以促进大模型的安全与可靠性发展。
梁思源何英哲刘艾杉李京知代朋纹操晓春
旁白、空间与想象性在场——基于《死囚越狱》的声音分析
2024年
《死囚越狱》是法国著名导演罗伯特·布列松早期创作中极具个人风格的作品,他在有限的画面之内运用音响与人声,让观众代替性地体验主人公方丹的越狱。文章对影片《死囚越狱》的声音设计进行分析,探讨罗伯特·布列松如何将声音的造型效果最大化并引导观众在观看过程中完成想象性在场的自我投射。
苏子秦
关键词:声景
越狱”机器人
2024年
T-1000是科幻电影《终结者2》中的反派机器人杀手,它的身体由液态记忆金属构成,能随意变形,甚至模仿他人的外貌;它在战斗时,身体的局部位置能瞬间变为金属利器;常规物理攻击无法对其造成伤害。
关键词:机器人科幻电影《终结者2》
针对大语言模型的越狱攻击方法及装置
本发明提供了一种针对大语言模型的越狱攻击方法及装置,包括:步骤S1根据提示、答案和连接模板构建初始越狱输入数据;步骤S2初始化对抗后缀;步骤S3根据对抗后缀与初始越狱输入数据得到越狱输入数据;步骤S4~S7根据越狱输入数...
马兴军 张家豪
越狱状态检测方法、装置、设备及存储介质
本申请实施例公开了一种越狱状态检测方法、装置、设备及存储介质,其包括:获取目标内存空间中存储的每个第一模块,所述目标内存空间为当前应用程序的内存空间,各所述第一模块中包括所述当前应用程序的主模块和至少一个非主模块;提取每...
郭浩

相关作者

孙莹
作品数:30被引量:15H指数:2
供职机构:渭南师范学院
研究主题:沉默 《越狱》 英文 社会语言学 非英语专业
王志亮
作品数:89被引量:102H指数:4
供职机构:上海政法学院
研究主题:监狱 犯罪 刑罚 监狱学 监狱行刑
范颖楠
作品数:26被引量:0H指数:0
供职机构:江苏省海门市东洲小学
研究主题:小学生 阅读知识 语文学习 作文 老师
尹文菁
作品数:2被引量:0H指数:0
供职机构:山东艺术学院音乐学院
研究主题:《越狱》 个人主义 美国文化 个人主义思想 镜头
周唯
作品数:46被引量:0H指数:0
供职机构:海门市通源小学
研究主题:语文学习 小学生 阅读知识 作文 迟到