rl - a tianchi007 Collection

tianchi007 's Collections

rl

rl

updated Mar 11, 2025

START: Self-taught Reasoner with Tools

Paper • 2503.04625 • Published Mar 6, 2025 • 113
Towards an AI co-scientist

Paper • 2502.18864 • Published Feb 26, 2025 • 52
SWE-RL: Advancing LLM Reasoning via Reinforcement Learning on Open Software Evolution

Paper • 2502.18449 • Published Feb 25, 2025 • 75
MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Paper • 2502.14499 • Published Feb 20, 2025 • 194