RSS
10:07 · Mar 3, 2026 · Tue
FOUND "
延迟
" IN
LINUX DO Channel
ZTurboX
在
Qwen3.5-27B部署
中发帖
Qwen3.5-27B使用vllm部署,官方文档和vllm文档中命令好像不太一样,该如何使用命令启动服务,使模型具备较高的吞吐量和低延迟
官方文档:
python -m sglang.launch_server --model-path
Home
Powered by
BroadcastChannel
&
Sepia