Nemotron 3 Benchmark：Super 与 Nano 结果概览

了解 Nemotron 3 基准结果的读法，并对比 Super 与 Nano 的长上下文与吞吐表现。

2026/03/28

本页帮助你理解 Nemotron 3 的基准结果，并快速判断 Super 或 Nano 是否适合你的业务。

基准衡量什么

复杂任务的推理质量
最高 1M token 的长上下文稳定性
真实负载下的吞吐与延迟
代码与工具调用能力（如有公开）

官方基准来源

如何比较 Super 与 Nano

长上下文：用真实长文档测试一致性与引用准确性。
延迟：测量首 token 时间与总延迟。
质量：用简单评分表评估准确度、完整度、引用质量。
成本：对比 GPU 成本或 API 成本。

快速测试清单

对两款模型使用完全相同的提示词。
记录 tokens/sec 与首 token 时间。
观察长上下文中是否出现结论漂移。
记录失败样例用于部署决策。

相关指南