robertgshaw2-neuralmagic

Robert Shaw robertgshaw2-neuralmagic

Sponsoring

vllm-project/vllm vllm-project/vllm Public

A high-throughput and memory-efficient inference and serving engine for LLMs

Python 29.9k 4.5k
vllm-project/llm-compressor vllm-project/llm-compressor Public

Transformers-compatible library for applying various compression algorithms to LLMs for optimized deployment with vLLM

Python 662 54