🎮 Reinforcement Learning - jyunzhang · Scour

Reinforcement Learning for Flow-Matching Policies with Density Transport

📈Optimization Academic

Cooperative Long Rope Skipping via Multi-Agent Reinforcement Learning

🤖AI Academic

COP-Q: Safety-First Reinforcement Learning for Robot Control via Cholesky-Ordered Projection

🎭Anthropic Claude Academic

Constrained Deep Reinforcement Learning for Cognitive Radar Resource Management

🧠Deep Learning Academic

HARBOR: A Harness Framework for Agentic Robot Reinforcement Learning

🎭Anthropic Claude Academic

Learning to Attack and Defend: Adaptive Red Teaming of Language Models via GRPO

🤖Transformers Academic

Trace-Mediated Peak Bias: Bridging Temporal Credit Assignment and Cognitive Heuristics in Deep Reinforcement Learning

📈Optimization Academic

PRPO: Perception-Reinforced Policy Optimization via Token-Level Dynamic Advantage Reshaping

📈Optimization Academic

Learning to replenish: A hybrid deep reinforcement learning for dynamic inventory management in the pharmaceutical supply chains

🤖Machine Learning Academic

Exact Unlearning in Reinforcement Learning

🤖LLMs Academic

Fog of Love: Engineering Virtuous Agent Behavior with Affinity-based Reinforcement Learning in a Game Environment

📈Optimization Academic

Drag reduction or reward hacking? Recurrent multi-agent reinforcement learning that earns its reward

🔲Cellular Automata Academic

Selective-Advantage Entropy-Adaptive Horizon GRPO: Asymmetric Token-Level Discounting for Efficient Reinforcement Learning of Language Models

📈Optimization Academic

Smart Transportation Without Neurons -- Fair Metro Network Expansion with Tabular Reinforcement Learning

🎭Anthropic Claude Academic

Explainably Safe Reinforcement Learning

💬Prompt Engineering Academic

From Ticks to Flows: Dynamics of Neural Reinforcement Learning in Continuous Environments

🧠Deep Learning Academic

GARL: Game-Theoretic Reinforcement Learning for Multi-Agent Strategic Prioritisation

⚙️Concurrency Models Academic

Self-Optimizing Control of Continuous Processes Based on Reinforcement Learning

📈Optimization Academic

Merging model-based control with multi-agent reinforcement learning for multi-agent cooperative teaming strategies

🤖AI Academic

RUBAS: Rubric-Based Reinforcement Learning for Agent Safety

🔐Cryptography Academic

Log in to enable infinite scrolling