Xin Li's picture

Xin Li PRO

lixin4ever

·

https://lixin4ever.github.io/

lixin4ever

AI & ML interests

Natural Language Processing, Machine Learning

Recent Activity

upvoted a paper about 20 hours ago

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

liked a dataset about 20 hours ago

DAMO-NLP-SG/multimodal_textbook

upvoted a paper about 24 hours ago

VideoRefer Suite: Advancing Spatial-Temporal Object Understanding with Video LLM

View all activity

Organizations

Papers 7

arxiv:2410.12787

arxiv:2410.12490

arxiv:2407.19672

arxiv:2406.07476

spaces 2

Running on Zero

VideoLLaMA2 AV

VideoLLaMA2-AV

Running on Zero

VideoLLaMA2

Media understanding

models

None public yet

datasets

None public yet