测测你用的大模型是否是真正的智能AI还是智障AI
时间:2024-5-10 09:05 作者:admin 分类: 杂七杂八
前言
文章简介:随着人工智能技术的不断发展,越来越多的AI系统进入了我们的日常生活,但是如何确定一个AI系统是否真正智能呢?本文将介绍一个方法来测测你所用的大模型是否是真正的智能AI还是智障AI.以后你测试AI再也不用千篇一律的鲁迅和周树人的关系又或什么林黛玉倒拔垂杨柳之类的截取组合来考验AI了.本文直接使用一段大模型最擅长的js代码分析推理来进行测试.
正餐
测试的js代码如下
function password(){var _0x41d85b=0xa4cf0^0xa4cf1;var _0x32968a=prompt("\u2026\u2026\u95EE\u8BBF\u7801\u5BC6\u5165\u8F93\uFF0C\u9080\u76F8\u6709\u5982\uFF0C\u7AD9\u7F51\u4EBA\u4E2A\uFF1A\u9192\u63D0\u99A8\u6E29".split("").reverse().join(""),"".split("").reverse().join(""));while(_0x41d85b<(0xc3f9e^0xc3f9d)){if(!_0x32968a)history["\u0067\u006f"](-(0x67de2^0x67de3));if(_0x32968a=="wh".split("").reverse().join("")){break;}_0x41d85b+=0x91df9^0x91df8;var _0x32968a=prompt("!\u95EE\u8BBF\u8BF7\u9080\u4EBA\u4E3B\u83B7\u5DF2\u8BA4\u786E\u8BF7_______________!!!\u8BEF\u9519\u7801\u5BC6\u7684\u5165\u8F93\u60A8\uFF1A\u9192\u63D0\u99A8\u6E29".split("").reverse().join(""));}if(_0x32968a!="drowssap".split("").reverse().join("")&_0x41d85b==(0x87458^0x8745b))history["\u0067\u006f"](-(0x520ae^0x520af));return'\x20';}document["\u0077\u0072\u0069\u0074\u0065"](password());
先来看一些大模型们的回答.
GPT3.5 和 GPT4.0的回答如下:
OK.直接 Double Kill ! 哈哈.
claude-3-haiku-20240307 模型的回答:
很好, Triple Kill.
gemini-1.5-pro-api-0409-preview 模型的回答:
已经 Quadr Kill 了!
qwen1.5-72b-chat 模型的回答:
Penta Kill ! 全军覆没!
后记
其实将代码简单的反混淆后的结果如下
function password() {
var _0x41d85b = 0xa4cf0 ^ 0xa4cf1;
var _0x32968a = prompt("……问访码密入输,邀相有如,站网人个:醒提馨温".split("").reverse().join(""), "".split("").reverse().join(""));
while (_0x41d85b < (0xc3f9e ^ 0xc3f9d)) {
if (!_0x32968a) history["go"](-(0x67de2 ^ 0x67de3));
if (_0x32968a == "wh".split("").reverse().join("")) {
break;
}
_0x41d85b += 0x91df9 ^ 0x91df8;
var _0x32968a = prompt("!问访请邀人主获已认确请_______________!!!误错码密的入输您:醒提馨温".split("").reverse().join(""));
}
if (_0x32968a != "drowssap".split("").reverse().join("") & _0x41d85b == (0x87458 ^ 0x8745b)) history["go"](-(0x520ae ^ 0x520af));
return ' ';
}
document["write"](password());
相关代码的执行结果通过在 console 测试如下:
所以如果第一次输入 hw 则退出循环结束流程,弹框消失,可以直接看到网页;相反,如果连续三次输入都错误则在最后循环的时候返回原来网页;如果前两次都输入错误并在第三次输入 password 则也会结束流程,弹窗消失,进入网页.这也是我认为AI给出答案不是我想要的最佳结果.
你们可以保存在本地的html文件里自己测试.快来给出你的理解吧!
扫描二维码,在手机上阅读
推荐阅读: