Jian Hu's picture

Jian Hu

chuyi777

·

https://hujian.website

hijkzzz

AI & ML interests

Reinforcement Learning

Recent Activity

upvoted a paper 3 days ago

REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models

commented a paper 3 days ago

REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models

liked a dataset 8 days ago

AI-MO/NuminaMath-CoT

View all activity

Organizations

Papers 2

arxiv:2501.03262

arxiv:2405.11143

models

None public yet

datasets

None public yet