项目简介

DeepSeek-VL2，这是一个高级系列的大型专家混合（MoE）视觉语言模型，对其前身DeepSeek-VL有显著改进。DeepSeek-VL2在各种任务中展示了卓越的能力，包括但不限于视觉回答问题、光学字符识别、文档/表格/图表理解和视觉接地。我们的模型系列由三个变体组成：DeepSeek-VL2-Tiny、DeepSeek-VL2-Small和DeepSeek-VL2，分别具有1.0B、2.8B和4.5B激活参数。与现有的开源密集和基于MoE的模型相比，DeepSeek-VL2以类似或更少的激活参数实现了有竞争力或最先进的性能。

项目简介

其他