DINOv2

元宇宙技术

元宇宙建设添利器 Meta强推视觉大模型多模态AI有望加速发展

在AI大模型竞赛中，Meta选择重押视觉模型，继推出零样本分割一切的SAM后，扎克伯格亲自官宣了重量级开源项目DINOv2。据介绍，DINOv2是计算机视觉领域的预训练大模型，模型参数量是10亿级，采用Transformer架构，能在语义分割、图像检索和深度估计等方面实现自监督训练，不需微调即可用于多种下游任务，可以被用于改善医学成像、粮食作物生长、地图绘制等。 DINOv2 用于语义分割，将图中每个像素划分类别 DINOv2 用于图像检索，查找与给定图像相关的图 DINOv2用于深度估计，给出图中物体到镜头的距离信息 DINOv2有何亮点？主要体现在两方面——DINOv2可以为大语言模型…

资讯林
2023年4月23日
08.4K