10 11 13

Wenqi Zhang

zwq2018

zwq2018

AI & ML interests

LLM, Multimodal, Robotics

Recent Activity

updated a dataset about 5 hours ago

DAMO-NLP-SG/multimodal_textbook

upvoted a collection about 18 hours ago

Jan 10 Releases 🌨️

authored a paper 4 days ago

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

View all activity

Organizations

zwq2018's activity

updated a dataset about 5 hours ago

DAMO-NLP-SG/multimodal_textbook

Updated about 5 hours ago • 2.09k • 63

upvoted a collection about 18 hours ago

Jan 10 Releases 🌨️

Collection

38 items • Updated 1 day ago • 10

authored a paper 4 days ago

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

Paper • 2501.00958 • Published 10 days ago • 91

commented 2 papers 8 days ago

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

Paper • 2501.00958 • Published 10 days ago • 91 •

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

Paper • 2501.00958 • Published 10 days ago • 91 •

upvoted a paper 8 days ago

VideoRefer Suite: Advancing Spatial-Temporal Object Understanding with Video LLM

Paper • 2501.00599 • Published 11 days ago • 40

commented a paper 9 days ago

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

Paper • 2501.00958 • Published 10 days ago • 91 •

upvoted a paper 9 days ago

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

Paper • 2501.00958 • Published 10 days ago • 91

commented a paper 9 days ago

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

Paper • 2501.00958 • Published 10 days ago • 91 •

liked a dataset 10 days ago

DAMO-NLP-SG/multimodal_textbook

Updated about 5 hours ago • 2.09k • 63

updated a dataset 10 days ago

DAMO-NLP-SG/multimodal_textbook

Updated about 5 hours ago • 2.09k • 63

liked a dataset 29 days ago

craigwu/vstar_bench

Viewer • Updated May 2, 2024 • 191 • 516 • 17

upvoted 2 papers 3 months ago

Infinity-MM: Scaling Multimodal Performance with Large-Scale and High-Quality Instruction Data

Paper • 2410.18558 • Published Oct 24, 2024 • 18

Distill Visual Chart Reasoning Ability from LLMs to MLLMs

Paper • 2410.18798 • Published Oct 24, 2024 • 20

commented 2 papers 3 months ago

Distill Visual Chart Reasoning Ability from LLMs to MLLMs

Paper • 2410.18798 • Published Oct 24, 2024 • 20 •

Distill Visual Chart Reasoning Ability from LLMs to MLLMs

Paper • 2410.18798 • Published Oct 24, 2024 • 20 •

upvoted 2 papers 3 months ago

Can Knowledge Editing Really Correct Hallucinations?

Paper • 2410.16251 • Published Oct 21, 2024 • 54

Breaking the Memory Barrier: Near Infinite Batch Size Scaling for Contrastive Loss

Paper • 2410.17243 • Published Oct 22, 2024 • 89

updated a dataset 3 months ago

zwq2018/Multi-modal-Self-instruct

Viewer • Updated Oct 16, 2024 • 76k • 197 • 22

liked a dataset 4 months ago

HuggingFaceM4/WebSight

Viewer • Updated Mar 26, 2024 • 2.75M • 3.61k • 340