英伟达开源 OCR 代码推理 AI 模型：LiveCodeBench 基准超 OpenAI o3-Mini 和 o1（low）-灵析社区

英伟达近期发布了开源的OCR代码推理AI模型LiveCodeBench，提供了三种不同规模的模型，分别为32B、14B和7B，采用Nemotron架构进行训练，并且这些模型采用Apache 2.0许可证开放。此OCR套件在LiveCodeBench基准测试中表现出色，超越了OpenAI的o3-Mini和o1 (low)模型。这些模型适用于不同的应用场景：32B适用于高性能推理和研究，14B则在计算需求较低的情况下维持了强大的推理能力，7B则适合资源受限的环境。32B版本提供了指令微调功能，支持与开放推理生态系统兼容，如 llama.cpp、vLLM、Hugging Face Transformers等主流框架。模型的训练使用了一个名为“OCR数据集”的定制数据集，专注于高质量代码训练，强调指令遵循、推理能力和多步骤问题解决能力。英伟达的这一模型展示了其在代码推理领域的优势，尤其是在开发者环境中，展示了出色的性能表现和广泛的适用性。 "Image 5" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/cad44fc1-e712-4575-98b4-df648494799e.png) 在LiveCodeBench测试中，OCR模型在多项基准测试中展现了其强大的能力，尤其在高性能推理场景中，表现优异。