Nemotron 3 Benchmark:Super 与 Nano 结果概览
了解 Nemotron 3 基准结果的读法,并对比 Super 与 Nano 的长上下文与吞吐表现。
2026/03/28
本页帮助你理解 Nemotron 3 的基准结果,并快速判断 Super 或 Nano 是否适合你的业务。
基准衡量什么
- 复杂任务的推理质量
- 最高 1M token 的长上下文稳定性
- 真实负载下的吞吐与延迟
- 代码与工具调用能力(如有公开)
官方基准来源
- NVIDIA Nemotron 3 Research Lab
- NVIDIA Nemotron 3 白皮书(PDF)
- NVIDIA Developer Blog:Nemotron 3 Super
- HuggingFace:Nemotron 3 Super
- HuggingFace:Nemotron 3 Nano
如何比较 Super 与 Nano
- 长上下文:用真实长文档测试一致性与引用准确性。
- 延迟:测量首 token 时间与总延迟。
- 质量:用简单评分表评估准确度、完整度、引用质量。
- 成本:对比 GPU 成本或 API 成本。
快速测试清单
- 对两款模型使用完全相同的提示词。
- 记录 tokens/sec 与首 token 时间。
- 观察长上下文中是否出现结论漂移。
- 记录失败样例用于部署决策。