Skip to content

Better HN

Top Best Ask Show New Jobs

Skipping 90% of KV dequant work speeds up LLM decode by 22% (opens in new tab)

(github.com)

1 pointspidtom3mo ago0 comments

0 comments

No comments yet.