init commit

2025-06-10 00:23:23 +08:00
commit a5a4909e6a
26 changed files with 1677 additions and 0 deletions
--- a/example.py
+++ b/example.py
@@ -0,0 +1,29 @@
+import os
+from nanovllm import LLM, SamplingParams
+from transformers import AutoTokenizer
+
+
+path = os.path.expanduser("~/huggingface/Qwen3-0.6B/")
+tokenizer = AutoTokenizer.from_pretrained(path)
+llm = LLM(path, enforce_eager=True)
+
+sampling_params = SamplingParams(temperature=0.6, max_tokens=256)
+prompts = [
+    "自我介绍一下吧！",
+    "列出100内所有素数",
+]
+prompts = [
+    tokenizer.apply_chat_template(
+        [{"role": "user", "content": prompt}],
+        tokenize=False,
+        add_generation_prompt=True,
+        enable_thinking=True
+    )
+    for prompt in prompts
+]
+completions = llm.generate(prompts, sampling_params)
+
+for p, c in zip(prompts, completions):
+    print("\n\n")
+    print(f"Prompt: {p}")
+    print(f"Completion: {c}")