🌐 World Models - asdfjllji · Scour

Event-Driven Reinforcement Learning Enables Long-Horizon Control in Semiconductor Fabrication

🎯Reinforcement Learning Academic

Representation Learning Enables Scalable Multitask Deep Reinforcement Learning

🎯Reinforcement Learning Academic

From Simulation to Real-World: An In-Field 6D Pose Dataset and Baseline for Robotic Strawberry Harvesting

🦿Robot Learning Academic

Reasoning or Memorization? Direction-Aware Diversity Exploration in LLM Reinforcement Learning

🎯Reinforcement Learning Academic

RLCSD: Reinforcement Learning with Contrastive On-Policy Self-Distillation

🎯Reinforcement Learning Academic

QnRL: Quantum-Native Reinforcement Learning

🎯Reinforcement Learning Academic

Progress-SQL: Improving Reinforcement Learning for Text-to-SQL via Progressive Rewards

🎯Reinforcement Learning Academic

On-sky demonstration of reinforcement learning for adaptive optics control

📄AI Research Academic

Deterministic Policy Gradient for Learning Equilibrium in Time-Inconsistent Control Problems

🎯Reinforcement Learning Academic

Cooperative Long Rope Skipping via Multi-Agent Reinforcement Learning

🧑‍🦾Humanoid Robots Academic

Performance Variation in Deep Reinforcement Learning

🎯Reinforcement Learning Academic

Critic Architecture Matters: Dual vs. Unified Critics for Humanoid Loco-Manipulation

🧑‍🦾Humanoid Robots Academic

GIFT: LLM-Guided State-Reward Interface for Financial Reinforcement Learning

🎯Reinforcement Learning Academic

Merging model-based control with multi-agent reinforcement learning for multi-agent cooperative teaming strategies

🎯Reinforcement Learning Academic

Architecture-Aware Reinforcement Learning Makes Sliding-Window Attention Competitive in Math Reasoning

📄AI Research Academic

Reinforcement Learning for Flow-Matching Policies with Density Transport

📄AI Research Academic

AllDayNav: Lifelong Navigation via Real-World Reinforcement Learning

🔭Vision-Language Academic

Self-Paced Curriculum Reinforcement Learning for Autonomous Superbike Racing in Simulation

🎯Reinforcement Learning Academic

Uncertainty-Aware LLM-Guided Policy Shaping for Sparse-Reward Reinforcement Learning

🎯Reinforcement Learning Academic

Offline Reinforcement Learning for Plasma Control in Nuclear Fusion: Codebase and Benchmark

🎯Reinforcement Learning Academic

Sign up or log in to see more results

Log in to enable infinite scrolling