🎯 Reinforcement Learning - tomas.burkert · Scour

Performance Variation in Deep Reinforcement Learning

🗣️LLMs Academic

Dmsh: A Multi-Agent Reinforcement Learning Framework for All-Quad Mesh Generation

💬Prompt Engineering Academic

TT-DAC-PS: Twin-Target Deterministic Actor-Critic with Policy Smoothing for Optimal Trade Execution

🤖AI Academic

Discovering Interpretable Multi-Parameter Control Policies for Evolutionary Algorithms Using Deep Reinforcement Learning

💬Prompt Engineering Academic

Structure-Conditioned Actor-Critic Branches for Quality-Diversity Reinforcement Learning

💬Prompt Engineering Academic

Geometry-Aware Reinforcement Learning for 2D Irregular Nesting

💬Prompt Engineering Academic

UNIQ: Conformal Calibration for Adaptive Conservatism in Offline Reinforcement Learning

💬Prompt Engineering Academic

SocraticPO: Policy Optimization via Interactive Guidance

🗣️LLMs Academic

Offline Reinforcement Learning for Plasma Control in Nuclear Fusion: Codebase and Benchmark

💬Prompt Engineering Academic

On-sky demonstration of reinforcement learning for adaptive optics control

💬Prompt Engineering Academic

Policy Gradient for Continuous-Time Robust Markov Decision Processes

💬Prompt Engineering Academic

Uncertainty-Aware LLM-Guided Policy Shaping for Sparse-Reward Reinforcement Learning

🗣️LLMs Academic

Beyond Uniform Token-Level Trust Region in LLM Reinforcement Learning

🗣️LLMs Academic

Towards End to End Motion Planning and Execution for Autonomous Underwater Vehicles Using Reinforcement Learning

💬Prompt Engineering Academic

RoboNaldo: Accurate, Stable and Powerful Humanoid Soccer Shooting via Motion-Guided Curriculum Reinforcement Learning

🤖AI Academic

Representation Learning Enables Scalable Multitask Deep Reinforcement Learning

💬Prompt Engineering Academic

Reinforcement Learning for Flow-Matching Policies with Density Transport

🗣️LLMs Academic

Event-Driven Reinforcement Learning Enables Long-Horizon Control in Semiconductor Fabrication

💬Prompt Engineering Academic

Rethinking the Divergence Regularization in LLM RL

🗣️LLMs Academic

How Does Reasoning Flow? Tracing Attention-Induced Information Flow for Targeted RL in LLMs

🗣️LLMs Academic

Log in to enable infinite scrolling