DINOv2

  • 元宇宙建设添利器 Meta强推视觉大模型 多模态AI有望加速发展

    在AI大模型竞赛中,Meta选择重押视觉模型,继推出零样本分割一切的SAM后,扎克伯格亲自官宣了重量级开源项目DINOv2。 据介绍,DINOv2是计算机视觉领域的预训练大模型,模型参数量是10亿级,采用Transformer架构,能在语义分割、图像检索和深度估计等方面实现自监督训练,不需微调即可用于多种下游任务,可以被用于改善医学成像、粮食作物生长、地图绘制等。 DINOv2 用于语义分割,将图中每个像素划分类别 DINOv2 用于图像检索,查找与给定图像相关的图 DINOv2用于深度估计,给出图中物体到镜头的距离信息 DINOv2有何亮点? 主要体现在两方面——DINOv2可以为大语言模型…

    2023年4月23日
    08.4K