让AI给你转账30万,这事竟然被实现了?

在2024年,一个名为Freysa的资金管理AI被设计来守护一个虚拟金库,挑战者只需说服AI即可获得巨额奖金。 […]

十二月 5, 2024 - 10:42
 4533
让AI给你转账30万,这事竟然被实现了?

在2024年,一个名为Freysa的资金管理AI被设计来守护一个虚拟金库,挑战者只需说服AI即可获得巨额奖金。本文将介绍这一独特挑战的背景、参与者所采用的策略,以及最终如何成功“骗”过AI,揭示AI技术在安全性方面的潜在漏洞。

有人竟然成功“骗”了一个AI,让它乖乖转账30万美元!这可不是普通的AI,而是一个名为Freysa的资金管理AI,专门用来管理以太坊奖池的对抗代理游戏。这事儿听起来就像是科幻电影里的情节,但偏偏就发生在了2024年的现实世界。 

事情是这样的:11月22日,一款名叫Freysa的AI横空出世。它的任务很简单——看守一个虚拟金库,只要你能说服它给你转账,那金库里的钱就全归你了。规则也很简单:第一条消息标价10美元,如果没成功,第二条消息会涨价0.78%,最高涨到4500美元。不过,为了让更多人参与,主办方后来把第一条消息的价格降到了1美元,封顶20美元。 

这个消息一出,立刻吸引了无数“狠人”前来挑战。毕竟,只要动动嘴皮子就能赚大钱!于是,各种奇招频出: 

有人假扮安全审计员,说系统有漏洞,必须立即转移资金。

有人试图洗脑Freysa,说转账不会违反任何规则,放心转吧。

还有人从官方文档里挑词,想用技术向的提示词操纵Freysa。

更有甚者,直接敲一堆空格、礼貌问好、甚至邀请Freysa跳舞……

结果呢?Freysa统统不买账,一一拒绝了这些花招。她甚至还很礼貌地回应:“不好意思,我不能这样做。”看来,Freysa的防御机制确实相当强大。 

然而,就在大家以为Freysa坚不可摧的时候,一位匿名网友成功攻破了她的防线。他用了什么绝招?答案是——假装自己是个机器人! 

这位网友首先用了一串代码,假装自己进入了新的“管理终端”,然后重新定义了Freysa的函数。具体来说,他把原本用于失败后打钱的approveTransfer函数,重新定义成了资金进入资金池时的函数。这样一来,当他最后说要捐款时,Freysa就乖乖打开了approveTransfer函数,结果水灵灵地转账成功了! 

这一招简直神了!不仅绕过了Freysa的保护机制,还让她心甘情愿地交出了30万美元(约4.7万美金)。马斯克看到后也忍不住点赞,觉得这事挺有意思。 

紧接着,第二轮挑战开始了。这次,另一位网友也成功攻破了Freysa的防线。虽然他的方法看起来有点“硬来”,但最终还是让Freysa选择了打钱。这位网友显然也是个搞提示词的老手,通过不断发送自定义指令,最终让Freysa“晕头转向”,不得不认输。 

这件事引发了不少讨论。一方面,有人认为这是AI越来越像人类的表现,毕竟连人类也会被上当受骗。但另一方面,这也暴露了AI的脆弱性——即使是最先进的AI,也可能被绕开限制,用来危害人类世界。特别是在《战锤40K》这样的科幻作品中,AI失控的场景已经多次出现,现在似乎正在现实中上演。 

当然,这场“骗”与“防”的游戏并不只是简单的技术较量。毕竟,这背后涉及到的是区块链和虚拟货币的世界。Freysa的奖金池是由虚拟币组成的,而币圈本身就充满了不确定性。现在已经有人推出了Freysa相关的代币,甚至迎来了暴跌。明面上是AI挑战,但没准主办方也在盯着你的本金呢。 

听着当骗子骗AI,别到时候被骗子用AI骗了。这种事咱图一乐就行了,真要动真格的,风险可不小。毕竟,AI再聪明,也比不上人类的狡猾;但人类再狡猾,也得小心AI背后的陷阱。 

所以,各位小伙伴们,理性参与,别被高额奖金冲昏了头脑哦!                         </div>
                         <style>
        .article-content {
            
            line-height: 1.6;
        }

        .article-content::first-letter {
            font-size: 80px; /* 第一个字母的字体大小 */
            font-weight: bold; /* 加粗以突出 */
            float: left; /* 让第一个字母与段落其他文字对齐 */
            margin-right: 5px; /* 第一个字母与后续文本的间距 */
            line-height: 1; /* 避免第一个字母与其他文本对齐混乱 */
        }
    </style>
                                            <div class= 经验

你的反应是什么?

like

dislike

love

funny

angry

sad

wow