Tag
你的1.5B模型能跑80分数学题?DeepSeek-R1-Distill-Qwen-1.5B验证指南 1. 小钢炮模型初探 DeepSeek-R1-Distill-Qwen-1.5B 是 DeepSeek 团队基于 Qwen-1.5B 模型,使用 80 万条 R1 推理链样本进行知识蒸馏得到的"小钢炮"模型。这个仅有 1.5B 参…
查看更多 2026-02-19
Demand feedback