🌐 World Models - samveed · Scour

Deterministic Policy Gradient for Learning Equilibrium in Time-Inconsistent Control Problems

🎮RL Academic

Event-Driven Reinforcement Learning Enables Long-Horizon Control in Semiconductor Fabrication

🎮RL Academic

Critic Architecture Matters: Dual vs. Unified Critics for Humanoid Loco-Manipulation

🎮RL Academic

Architecture-Aware Reinforcement Learning Makes Sliding-Window Attention Competitive in Math Reasoning

🎯Post-training Academic

On-sky demonstration of reinforcement learning for adaptive optics control

🎮RL Academic

Reasoning or Memorization? Direction-Aware Diversity Exploration in LLM Reinforcement Learning

🎮RL Academic

Representation Learning Enables Scalable Multitask Deep Reinforcement Learning

🎮RL Academic

QnRL: Quantum-Native Reinforcement Learning

🎮RL Academic

EEGDancer: Dynamic Emotion Latent Space Masked Modeling with Reinforcement Learning for EEG Continuous Emotion Prediction

🎮RL Academic

Cooperative Long Rope Skipping via Multi-Agent Reinforcement Learning

🎮RL Academic

RePAIR: Predictive Self-Supervised Representation Learning in Chess

🎮RL Academic

Reinforcement Learning for Flow-Matching Policies with Density Transport

📊ML Academic

PAWS: Preference Learning with Advantage-Weighted Segments

🎮RL Academic

Self-Paced Curriculum Reinforcement Learning for Autonomous Superbike Racing in Simulation

🎮RL Academic

Progress-SQL: Improving Reinforcement Learning for Text-to-SQL via Progressive Rewards

🎮RL Academic

GIFT: LLM-Guided State-Reward Interface for Financial Reinforcement Learning

🎮RL Academic

Improving Generalization and Data Efficiency with Diffusion in Offline Multi-agent RL

🎮RL Academic

Offline Reinforcement Learning for Plasma Control in Nuclear Fusion: Codebase and Benchmark

🎮RL Academic

Performance Variation in Deep Reinforcement Learning

🎮RL Academic

HERO: Hindsight-Enhanced Reflection from Environment Observations for Agentic Self-Distillation

🎮RL Academic

Sign up or log in to see more results

Log in to enable infinite scrolling