2 8 2

Xiyao Wang

russwang

AI & ML interests

None yet

Recent Activity

upvoted a paper 18 days ago

Offline Reinforcement Learning for LLM Multi-Step Reasoning

updated a model about 1 month ago

russwang/VisVM-LLaVA-Next-Mistral-7B

upvoted a paper about 1 month ago

Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling

View all activity

Organizations

russwang's activity

upvoted a paper 18 days ago

Offline Reinforcement Learning for LLM Multi-Step Reasoning

Paper • 2412.16145 • Published 22 days ago • 38

updated a model about 1 month ago

russwang/VisVM-LLaVA-Next-Mistral-7B

Updated Dec 11, 2024 • 12

upvoted 2 papers about 1 month ago

Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling

Paper • 2412.05271 • Published Dec 6, 2024 • 124

Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion

Paper • 2412.04424 • Published Dec 5, 2024 • 59

authored a paper about 1 month ago

Scaling Inference-Time Search with Vision Value Model for Improved Visual Comprehension

Paper • 2412.03704 • Published Dec 4, 2024 • 6

upvoted a paper about 1 month ago

Scaling Inference-Time Search with Vision Value Model for Improved Visual Comprehension

Paper • 2412.03704 • Published Dec 4, 2024 • 6

commented a paper about 1 month ago

Scaling Inference-Time Search with Vision Value Model for Improved Visual Comprehension

Paper • 2412.03704 • Published Dec 4, 2024 • 6 •

upvoted a paper about 1 month ago

SNOOPI: Supercharged One-step Diffusion Distillation with Proper Guidance

Paper • 2412.02687 • Published Dec 3, 2024 • 108

updated a dataset about 2 months ago

furonghuang-lab/Mementos

Preview • Updated Nov 14, 2024 • 5.5k

New activity in llava-hf/llava-v1.6-mistral-7b-hf 2 months ago

Evaluation

#35 opened 2 months ago by

russwang

authored 2 papers 3 months ago

Towards Self-Improvement of LLMs via MCTS: Leveraging Stepwise Knowledge with Curriculum Preference Learning

Paper • 2410.06508 • Published Oct 9, 2024 • 10

LLaVA-Critic: Learning to Evaluate Multimodal Models

Paper • 2410.02712 • Published Oct 3, 2024 • 35

upvoted a paper 3 months ago

LLaVA-Critic: Learning to Evaluate Multimodal Models

Paper • 2410.02712 • Published Oct 3, 2024 • 35

updated a dataset 4 months ago

russwang/chair_data

Updated Sep 23, 2024 • 3

liked a dataset 6 months ago

wangclnlp/vision-feedback-mix-binarized

Viewer • Updated Jul 17, 2024 • 196k • 31 • 4

upvoted a paper 6 months ago

LiteSearch: Efficacious Tree Search for LLM

Paper • 2407.00320 • Published Jun 29, 2024 • 37

upvoted a paper 7 months ago

VoCo-LLaMA: Towards Vision Compression with Large Language Models

Paper • 2406.12275 • Published Jun 18, 2024 • 29

updated a model 7 months ago

russwang/MCTS_DPO

Updated Jun 10, 2024

updated a dataset 7 months ago

furonghuang-lab/SIMA_prompts

Viewer • Updated Jun 7, 2024 • 17k • 38

authored a paper 11 months ago

Premier-TACO: Pretraining Multitask Representation via Temporal Action-Driven Contrastive Loss

Paper • 2402.06187 • Published Feb 9, 2024 • 9