nano-vllm/nanovllm/kvcache at 0a247ccb1b72dfb9e3d154add4f4cbe4be754ee2 - nano-vllm - Gitea: Git with a cup of tea

zijie-tian/nano-vllm

Files

History

Zijie Tian 0a247ccb1b [feat] Added num_gpu_blocks limit gpu blocks.

2025-12-10 20:17:42 +08:00

..

[feat] Added chunked prefill and kvcache offload mechenism.

2025-12-10 03:47:37 +08:00

__init__.py

[feat] Added chunked prefill and kvcache offload mechenism.

2025-12-10 03:47:37 +08:00

base_manager.py

[feat] Added chunked prefill and kvcache offload mechenism.

2025-12-10 03:47:37 +08:00

chunked_attention.py

[feat] Added chunked prefill and kvcache offload mechenism.

2025-12-10 03:47:37 +08:00

gpu_manager.py

[feat] Added chunked prefill and kvcache offload mechenism.

2025-12-10 03:47:37 +08:00

hybrid_manager.py

[refactor] Implement real chunked prefill mechenism.

2025-12-10 18:34:01 +08:00

kernels.py

[feat] Added chunked prefill and kvcache offload mechenism.

2025-12-10 03:47:37 +08:00

offload_engine.py

[feat] Added num_gpu_blocks limit gpu blocks.

2025-12-10 20:17:42 +08:00