🎯 Reinforcement Learning - asdfjllji · Scour

Space-sampled Value Decay: Forgetting Mechanisms for Non-stationary Deep Reinforcement Learning

🌐World Models Academic

Fast and Highly Expressive Policy Learning for Offline Reinforcement Learning via Bootstrapped Flow Q-Learning

🌐World Models Academic

Geometrically Averaged Hard Target Updates for Linear Q-Learning

🌐World Models Academic

TT-DAC-PS: Twin-Target Deterministic Actor-Critic with Policy Smoothing for Optimal Trade Execution

🌐World Models Academic

Retry Policy Gradients in Continuous Action Spaces

🦿Robot Learning Academic

Offline Reinforcement Learning for Plasma Control in Nuclear Fusion: Codebase and Benchmark

🦿Robot Learning Academic

Path Planning Using Deep Deterministic Policy Gradient: A Reinforcement Learning Approach

🌐World Models Academic

Self-evolving LLM agents with in-distribution Optimization

🌐World Models Academic

Semi-Offline Reinforcement Learning for Optimized Text Generation

🌐World Models Academic

Failure Modes of Deep Multi-Agent RL in Asynchronous Pricing: Reproducible Triggers, Trace Diagnostics, and a Partial Fix

🌐World Models Academic

Development of COVID-19 Booster Vaccine Policy by Microsimulation and Q-learning

🌐World Models Academic

Merging model-based control with multi-agent reinforcement learning for multi-agent cooperative teaming strategies

🌐World Models Academic

SHAPO: Sharpness-Aware Policy Optimization for Safe Exploration

🌐World Models Academic

Test-Time Gradient Guidance of Flow Policies in Reinforcement Learning

🦿Robot Learning Academic

On Advantage Estimates for Max@K Policy Gradients

🌐World Models Academic

Learning Predictive Control with Deep Koopman Operators for Autonomous Vehicle Motion Planning

🌐World Models Academic

Drag reduction or reward hacking? Recurrent multi-agent reinforcement learning that earns its reward

🌐World Models Academic

Dmsh: A Multi-Agent Reinforcement Learning Framework for All-Quad Mesh Generation

🌐World Models Academic

Self-Paced Curriculum Reinforcement Learning for Autonomous Superbike Racing in Simulation

🌐World Models Academic

Towards End to End Motion Planning and Execution for Autonomous Underwater Vehicles Using Reinforcement Learning

🌐World Models Academic

Log in to enable infinite scrolling