garrett4wade

Follow

Wei Fu garrett4wade

Follow

Ph.D. student in Tsinghua

72 followers · 10 following

Tsinghua University
Beijing, China

Achievements

Achievements

Pinned Loading

openpsi-project/ReaLHF openpsi-project/ReaLHF Public archive

Super-Efficient RLHF Training of LLMs with Parameter Reallocation

Python 319 20
revisiting_marl revisiting_marl Public

Official codebase for paper "Revisiting Some Common Practices in Cooperative Multi-Agent Reinforcement Learning" (ICML22)

Python 23 1
cugae cugae Public

CUDA implementation of Generalized Advantage Estimation (GAE)

Python 4
scaling_marl scaling_marl Public

Python
inclusionAI/AReaL inclusionAI/AReaL Public

Lightning-Fast RL for LLM Reasoning and Agents. Made Simple & Flexible.

Python 2.7k 193