🎮 Reinforcement Learning - gautam6599123 · Scour

Cooperative Long Rope Skipping via Multi-Agent Reinforcement Learning

🤖AI Academic

Path Planning Using Deep Deterministic Policy Gradient: A Reinforcement Learning Approach

∂Automatic Differentiation Academic

GIFT: LLM-Guided State-Reward Interface for Financial Reinforcement Learning

🤖AI Academic

Claw-R1: A Step-Level Data Middleware System for Agentic Reinforcement Learning

🗣️Large Language Models Academic

Self-evolving LLM agents with in-distribution Optimization

🗣️Large Language Models Academic

Uncertainty-Aware LLM-Guided Policy Shaping for Sparse-Reward Reinforcement Learning

🤖Transformers Academic

Learning Multi-Agent Communication Protocol: Study on Information Entropy Efficiency in MARL

📊Optimization Academic

Exploring Agentic Tool-Calling Decisions via Uncertainty-Aligned Reinforcement Learning

∂Automatic Differentiation Academic

The Sim-to-Real Gap of Foundation Model Agents: A Unified MDP Perspective

∂Automatic Differentiation Academic

Fog of Love: Engineering Virtuous Agent Behavior with Affinity-based Reinforcement Learning in a Game Environment

📊Optimization Academic

Progress-SQL: Improving Reinforcement Learning for Text-to-SQL via Progressive Rewards

🗣️Large Language Models Academic

Enhancing the MADDPG Algorithm for Multi-Agent Learning via Action Inference and Importance Sampling

∂Automatic Differentiation Academic

Declarative Skills for AI Agents in Knowledge-Grounded Tool-Use Workflows

🗣️Large Language Models Academic

Baichuan-M4: A Clinical-Grade Medical Agent System for Continuous Care

🤖AI Academic

GARL: Game-Theoretic Reinforcement Learning for Multi-Agent Strategic Prioritisation

🎯Decision Theory Academic

Modelling Opinion Dynamics at Scale with Deep MARL

🎯Decision Theory Academic

Merging model-based control with multi-agent reinforcement learning for multi-agent cooperative teaming strategies

🤖AI Academic

QnRL: Quantum-Native Reinforcement Learning

🎲Probability Theory Academic

RUBAS: Rubric-Based Reinforcement Learning for Agent Safety

∂Automatic Differentiation Academic

Quantum-Inspired Reinforcement Learning for Low-Latency Intrusion Detection in V2X and Internet-of-Vehicles Networks

∂Automatic Differentiation Academic

Log in to enable infinite scrolling