英伟达开源 OCR 代码推理 AI 模型:LiveCodeBench 基准超 OpenAI o3-Mini 和 o1(low)-灵析社区

AI资讯

英伟达近期发布了开源的OCR代码推理AI模型LiveCodeBench,提供了三种不同规模的模型,分别为32B、14B和7B,采用Nemotron架构进行训练,并且这些模型采用Apache 2.0许可证开放。此OCR套件在LiveCodeBench基准测试中表现出色,超越了OpenAI的o3-Mini和o1 (low)模型。 这些模型适用于不同的应用场景:32B适用于高性能推理和研究,14B则在计算需求较低的情况下维持了强大的推理能力,7B则适合资源受限的环境。32B版本提供了指令微调功能,支持与开放推理生态系统兼容,如 llama.cpp、vLLM、Hugging Face Transformers等主流框架。 模型的训练使用了一个名为“OCR数据集”的定制数据集,专注于高质量代码训练,强调指令遵循、推理能力和多步骤问题解决能力。 英伟达的这一模型展示了其在代码推理领域的优势,尤其是在开发者环境中,展示了出色的性能表现和广泛的适用性。 "Image 5" (https://wm-ai.oss-cn-shanghai.aliyuncs.com/test/cad44fc1-e712-4575-98b4-df648494799e.png) 在LiveCodeBench测试中,OCR模型在多项基准测试中展现了其强大的能力,尤其在高性能推理场景中,表现优异。

阅读量:333

点赞量:14

收藏量:0