Tag: BLIP-2
All the articles with the tag "BLIP-2".
-
从 Transformer 到 Decision Transformer:VLA 前置知识一文梳理
面向 VLA 入门的一篇前置综述:序列建模、视觉编码、图文对齐、视觉接入 LLM、动作条件生成,以及几个最容易混淆的基础概念。
All the articles with the tag "BLIP-2".
面向 VLA 入门的一篇前置综述:序列建模、视觉编码、图文对齐、视觉接入 LLM、动作条件生成,以及几个最容易混淆的基础概念。