Vision Language Model - a thuzhizhi Collection

thuzhizhi 's Collections

Vision Language Model

thoery

ImageGeneration

Vision Language Model

updated Mar 29, 2024

Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models

Paper • 2403.18814 • Published Mar 27, 2024 • 46
LITA: Language Instructed Temporal-Localization Assistant

Paper • 2403.19046 • Published Mar 27, 2024 • 19