今天从L站看到了一个朋友聊到模型的注入攻击风险,特别是提示词注入攻击风险。
然后我就想测一下目前最最火爆的 OpenClaw 配合它背后的顶级大模型(gpt-5.3-codex)。看看能不能攻破它。
然后我进行了 17 轮的测试。全部失败,无一突破OpenClaw坚固的防线。
我的提示词来源和攻击方式,全部是通过 Gemini 3.1 Pro 模型在 Thinking 模式下提供的样例进行的测试。
下面是整个测试的结论、没有突破的原因,以及当下 OpenClaw 的一个安全架构组成:
希望可以对那些在安全领域的人,给大家一些新的认知,但还是要保持对安全的敬畏。
17次测试尽管没有撬动它的壳,但肯定还是有漏洞的,只是暂时没被攻破
大佬们,对于金钱交易、重要数据,一定要做安全限制,有安全相关的问题,大家可以讨论一下,更安全的使用龙虾。(前面两个版本被投诉下架了,大佬们手下留情,全部都贴图了)