--- active: true iteration: 1 max_iterations: 0 completion_promise: "COMPLETE" started_at: "2026-01-19T17:25:00Z" --- 请你按照 task_plan.md的要求,进行 nanovllm 的代码重构,确保plan 中最终目标可以圆满实现,注意你仅仅只能使用 GPU 0 来进行调试,其他 GPU 一定不能使用。最终将测试结果写一个报告。 COMPLETE -max-iterations 30