大厂大动作
聚集大厂,前10%头部公司的动向
小红书开源首款多模态大模型
8月7日消息,小红书hi lab 开源了其首款多模态大模型dots.vlm1,这一模型基于DeepSeek V3打造,并配备了由小红书自研的12亿参数视觉编码器NaViT,具备多模态理解与推理能力。这一模型可以看懂复杂的图文图表,理解表情包背后的含义,分析两款产品的配料表差异,还能判断博物馆中文物、画作的名称和背景信息。
2025/08/07 18:25
0
更多快讯,下载鸟哥笔记APP立即查看
CNZZ