Skip to content

Better HN

Top Best Ask Show New Jobs

1M Tokens/s: Scaling Qwen 3.5 27B on 96 B200 GPUs with vLLM (opens in new tab)

(medium.com)

3 pointsm4r1k3mo ago0 comments

0 comments

No comments yet.