分享
谁是视觉推理 AI 之王?一场游戏,横评 5 大顶流模型
输入“/”快速插入内容
谁是视觉推理 AI 之王?一场游戏,横评 5 大顶流模型
用户3576
用户3576
1月26日修改
Claude 差点垫底…
👋 Hi,我想先请你只看下面这张照片,推测它的拍摄城市:
这是一类叫做
「网络迷踪」
的推理游戏:只看照片,判断拍摄地点的位置,距离越近,得分越高。
游戏过程是这样的 🔊:
这太适合测试 AI 的视觉推理能力了
。
完美模拟了人类玩家的视觉推理过程:
1️⃣ 精准识别视觉元素:解读路牌文字、辨认植被类型、分析建筑风格特征;
2️⃣ 调用知识储备:判断特定电线杆造型属于哪个国家或地区;
3️⃣ 以及多层次线索整合推理。
要想在这个游戏中取得好成绩,AI 们必须同时发挥其
视觉识别、模型知识、逻辑推理的最大潜能
。
当 AI 答题结果被标注在地图上后,它们之间的智力差距也就一目了然。
比单一维度的 Benchmark 跑分,能更有趣、直观的看到模型的差距。
所以我拉上了国内外 5 个顶流多模态推理模型,一起来做了这项比赛。
你猜,谁是视觉推理 AI 之王?