🎯 Reinforcement Learning - elasticbounce · Scour

Representation Learning Enables Scalable Multitask Deep Reinforcement Learning

🔄Continual Learning Academic

An Agency-Transferring Model-Free Policy Enhancement Technique

🧠Active Inference Academic

QnRL: Quantum-Native Reinforcement Learning

🧠Active Inference Academic

Learning to replenish: A hybrid deep reinforcement learning for dynamic inventory management in the pharmaceutical supply chains

🧬Evolutionary Computation Academic

UNIQ: Conformal Calibration for Adaptive Conservatism in Offline Reinforcement Learning

🧠Active Inference Academic

On Advantage Estimates for Max@K Policy Gradients

🧠Active Inference Academic

Learning Predictive Control with Deep Koopman Operators for Autonomous Vehicle Motion Planning

⚙️Computational Mechanics Academic

Offline Reinforcement Learning for Plasma Control in Nuclear Fusion: Codebase and Benchmark

🔄Continual Learning Academic

GARL: Game-Theoretic Reinforcement Learning for Multi-Agent Strategic Prioritisation

🐝Collective Intelligence Academic

Cooperative Long Rope Skipping via Multi-Agent Reinforcement Learning

🐝Collective Intelligence Academic

Belief-Space Quantum-Inspired Reinforcement Learning for Partially Observable Autonomous Cyber Defense in the Internet of Vehicles

🧠Neuromorphic Computing Academic

Fog of Love: Engineering Virtuous Agent Behavior with Affinity-based Reinforcement Learning in a Game Environment

🐝Collective Intelligence Academic

Reformulate LLM Reinforcement Learning for Efficient Training under Black-box Discrepancy

🧠Active Inference Academic

Policy-Conditioned Counterfactual Credit for Verifiable Reinforcement Learning of Long-Horizon Language Agents

🧠Active Inference Academic

Agentic Monte Carlo: Simulating Reinforcement Learning for Black-Box Agents

🧠Active Inference Academic

COP-Q: Safety-First Reinforcement Learning for Robot Control via Cholesky-Ordered Projection

🤖Developmental Robotics Academic

RUBAS: Rubric-Based Reinforcement Learning for Agent Safety

⚙️Computational Mechanics Academic

Reinforcement Learning from Rich Feedback with Distributional DAgger

🧠Active Inference Academic

BiasGRPO: Stabilizing Bias Mitigation in High-Variance Reward Landscapes via Group-Relative Policy Optimization

🧬Evolutionary Computation Academic

Retry Policy Gradients in Continuous Action Spaces

🧠Active Inference Academic

Sign up or log in to see more results

Log in to enable infinite scrolling