小红书开源首款多模态大模型

大厂大动作

聚集大厂，前10%头部公司的动向

小红书开源首款多模态大模型

8月7日消息，小红书hi lab 开源了其首款多模态大模型dots.vlm1，这一模型基于DeepSeek V3打造，并配备了由小红书自研的12亿参数视觉编码器NaViT，具备多模态理解与推理能力。这一模型可以看懂复杂的图文图表，理解表情包背后的含义，分析两款产品的配料表差异，还能判断博物馆中文物、画作的名称和背景信息。

2025/08/07 18:25