RSS
13:35 · Feb 23, 2026 · Mon
FOUND "
Sni
" IN
LINUX DO Channel
@clow7280
在
对镜举手问题,国产模型几乎全军覆没,GPT也没能幸免
中发帖
在“50米洗车”问题之后,对镜举手问题成为了新的一轮大模型的思维能力测试。
趁着Gemini 3.1 Pro的发布,对最近发布的大模型使用相同提示词进行一轮测试,结果令人咋舌。
——
测试方法:
[Snipast
Home
Powered by
BroadcastChannel
&
Sepia