🎮 Reinforcement Learning - gautam6599123 · Scour

Performance Variation in Deep Reinforcement Learning

🗣️Large Language Models Academic

Reinforcement learning in linear embedding space unlocks generalizable control across soft robot configurations

🤖AI Academic

Development of COVID-19 Booster Vaccine Policy by Microsimulation and Q-learning

🎲Probability Theory Academic

HIPIF: Hierarchical Planning and Information Folding for Long-Horizon LLM Agent Learning

🗣️Large Language Models Academic

Self-Paced Curriculum Reinforcement Learning for Autonomous Superbike Racing in Simulation

∂Automatic Differentiation Academic

3SPO: State-Score-Supervised Policy Optimization for LLM Agents

🗣️Large Language Models Academic

Failure Modes of Deep Multi-Agent RL in Asynchronous Pricing: Reproducible Triggers, Trace Diagnostics, and a Partial Fix

🤖AI Academic

UNIQ: Conformal Calibration for Adaptive Conservatism in Offline Reinforcement Learning

📊Optimization Academic

ARTA: Adaptive Reinforcement-Learning-Based Throttling Agent for RowHammer Vulnerabilities

🤖AI Academic

Beyond Uniform Token-Level Trust Region in LLM Reinforcement Learning

🗣️Large Language Models Academic

Deep reinforcement learning for process design: Review and perspective

🧠Deep Learning Academic

Flow-DPPO: Divergence Proximal Policy Optimization for Flow Matching Models

📡Information Theory Academic

SHAPO: Sharpness-Aware Policy Optimization for Safe Exploration

∂Automatic Differentiation Academic

Cooperative Long Rope Skipping via Multi-Agent Reinforcement Learning

🤖AI Academic

On-sky demonstration of reinforcement learning for adaptive optics control

📊Optimization Academic

Path Planning Using Deep Deterministic Policy Gradient: A Reinforcement Learning Approach

∂Automatic Differentiation Academic

Reasoning or Memorization? Direction-Aware Diversity Exploration in LLM Reinforcement Learning

📊Optimization Academic

Bellman-Taylor Score Decoding for Markov Decision Processes with State-Dependent Feasible Action Sets

∂Automatic Differentiation Academic

GIFT: LLM-Guided State-Reward Interface for Financial Reinforcement Learning

🤖AI Academic

Mitigating Bias in Low-SNR Financial Reinforcement Learning via Quantum Representations

📊Optimization Academic

Sign up or log in to see more results

Log in to enable infinite scrolling