Nemotron 3 Benchmark:Super 与 Nano 结果概览

了解 Nemotron 3 基准结果的读法,并对比 Super 与 Nano 的长上下文与吞吐表现。

2026/03/28

本页帮助你理解 Nemotron 3 的基准结果,并快速判断 Super 或 Nano 是否适合你的业务。

基准衡量什么

  • 复杂任务的推理质量
  • 最高 1M token 的长上下文稳定性
  • 真实负载下的吞吐与延迟
  • 代码与工具调用能力(如有公开)

官方基准来源

如何比较 Super 与 Nano

  1. 长上下文:用真实长文档测试一致性与引用准确性。
  2. 延迟:测量首 token 时间与总延迟。
  3. 质量:用简单评分表评估准确度、完整度、引用质量。
  4. 成本:对比 GPU 成本或 API 成本。

快速测试清单

  • 对两款模型使用完全相同的提示词。
  • 记录 tokens/sec 与首 token 时间。
  • 观察长上下文中是否出现结论漂移。
  • 记录失败样例用于部署决策。

相关指南