RSS
10:06 · Feb 28, 2026 · Sat
FOUND "
claude
" IN
LINUX DO Channel
Dong L (
@xdliu
)
在
Coding agent (不是model)大家一般看什么benchmark
中发帖
我理解模型的benchmark已经有很多了,各种SWE-bench的变形
但是实际开发大家都是用coding agent,这方面比较什么benchmark比较好
比如
Home
Powered by
BroadcastChannel
&
Sepia