🎯 Reinforcement Learning - tomas.burkert · Scour

From Ticks to Flows: Dynamics of Neural Reinforcement Learning in Continuous Environments

💬Prompt Engineering Academic

HARBOR: A Harness Framework for Agentic Robot Reinforcement Learning

💬Prompt Engineering Academic

3SPO: State-Score-Supervised Policy Optimization for LLM Agents

🗣️LLMs Academic

Self-Distilled Policy Gradient

💬Prompt Engineering Academic

ARTA: Adaptive Reinforcement-Learning-Based Throttling Agent for RowHammer Vulnerabilities

💬Prompt Engineering Academic

Self-Paced Curriculum Reinforcement Learning for Autonomous Superbike Racing in Simulation

💬Prompt Engineering Academic

SHAPO: Sharpness-Aware Policy Optimization for Safe Exploration

💬Prompt Engineering Academic

On Advantage Estimates for Max@K Policy Gradients

🗣️LLMs Academic

Claw-R1: A Step-Level Data Middleware System for Agentic Reinforcement Learning

🗣️LLMs Academic

Reasoning or Memorization? Direction-Aware Diversity Exploration in LLM Reinforcement Learning

🗣️LLMs Academic

Deep reinforcement learning for process design: Review and perspective

💬Prompt Engineering Academic

RL Excursions during Pre-Training: Re-examining Policy Optimization for LLM training

🗣️LLMs Academic

Mitigating Bias in Low-SNR Financial Reinforcement Learning via Quantum Representations

🤖AI Academic

GIFT: LLM-Guided State-Reward Interface for Financial Reinforcement Learning

🗣️LLMs Academic

MODIP: Efficient Model-Based Optimization for Diffusion Policies

🗣️LLMs Academic

Self-Optimizing Control of Continuous Processes Based on Reinforcement Learning

🧠Machine Learning Academic

Neuro-Symbolic Injection of LTLf Constraints in Autoregressive Reinforcement Learning Policies

🗣️LLMs Academic

Failure Modes of Deep Multi-Agent RL in Asynchronous Pricing: Reproducible Triggers, Trace Diagnostics, and a Partial Fix

🤖AI Academic

ConSteer-RL: Steering Reasoning Capabilities in Large Language Models via Confidence-Aware Reinforcement Learning

🗣️LLMs Academic

Exact Unlearning in Reinforcement Learning

🤖AI Academic

Sign up or log in to see more results

Log in to enable infinite scrolling