vllm-self

最近更新: 2个月前

Salt

最近更新: 2个月前

diy-llm

最近更新: 2个月前

Hands-On-Large-Language-Models-CN

最近更新: 2个月前

vllmLearn

最近更新: 3个月前

MemoryBank-SiliconFriend

最近更新: 4个月前

MinivLLM

最近更新: 4个月前

nano-vllm
Python
forked from 中国好男人/nano-vllm
Python

该项目是用 Python 实现的轻量级 vLLM(大语言模型推理引擎)项目,核心代码仅 1000 多行。它结构清晰、易于阅读,推理速度媲美 vLLM 原版,并集成了前缀缓存(Prefix Caching)、张量并行(Tensor Parallelism)和 Torch 编译等推理优化技术。

最近更新: 5个月前

搜索帮助