推荐 最新
byte10

InternLM

InternLM3 开源了一个拥有 80 亿参数的指令模型 InternLM3-8B-Instruct,该模型专为通用用途和高级推理而设计。该模型具有以下特点: 以更低的成本提高性能:在推理和知识密集型任务上的最佳性能超越了 Llama3.1-8B 和 Qwen2.5-7B 等模型。值得注意的是,InternLM3 仅使用 4 万亿个高质量 token 进行训练,与其他类似规模的 LLM 相比,节省了 75% 以上的训练成本。 深度思考能力:InternLM3既支持通过长链思维解决复杂推理任务的深度思考模式,也支持流畅的用户交互的正常响应模式。

20
0
0
浏览量44