分享
点赞 17
评论 0
DeepSeek-VL2 4726星
DeepSeek-VL2:高级多模态理解的混合专家视觉语言模型
项目来源:

项目简介

DeepSeek-VL2,这是一个高级系列的大型专家混合(MoE)视觉语言模型,对其前身DeepSeek-VL有显著改进。DeepSeek-VL2在各种任务中展示了卓越的能力,包括但不限于视觉回答问题、光学字符识别、文档/表格/图表理解和视觉接地。我们的模型系列由三个变体组成:DeepSeek-VL2-Tiny、DeepSeek-VL2-Small和DeepSeek-VL2,分别具有1.0B、2.8B和4.5B激活参数。与现有的开源密集和基于MoE的模型相比,DeepSeek-VL2以类似或更少的激活参数实现了有竞争力或最先进的性能。



其他