🎮 Reinforcement Learning - scour.speculate245 · Scour

Deep Reinforcement Learning for Adaptive Power Allocation in ISAC Systems with Mobile Target

🛡️AI Security Academic

Geometrically Averaged Hard Target Updates for Linear Q-Learning

🛡️AI Security Academic

Reinforcement learning in linear embedding space unlocks generalizable control across soft robot configurations

🛡️AI Security Academic

Phi-Actor-Critic: Steering General-Sum Games to Pareto-Efficient Correlated Equilibria

🎮Game Theory Academic

Fast and Highly Expressive Policy Learning for Offline Reinforcement Learning via Bootstrapped Flow Q-Learning

🛡️AI Security Academic

Improving Generalization and Data Efficiency with Diffusion in Offline Multi-agent RL

🛡️AI Security Academic

Reinforcement Learning Disrupts Gradient-Based Adversarial Optimization

🛡️AI Security Academic

Flow-DPPO: Divergence Proximal Policy Optimization for Flow Matching Models

🛡️AI Security Academic

CCKS: Consensus-based Communication and Knowledge Sharing

🎮Game Theory Academic

Space-sampled Value Decay: Forgetting Mechanisms for Non-stationary Deep Reinforcement Learning

🎮Game Theory Academic

Variational Proximal Policy Optimization

🛡️AI Security Academic

IAPO: Input Attribution-Aware Policy Optimization for Tool Use in Small Multimodal Agents

🛡️AI Security Academic

The Neutral Mask: How RLHF Provides Shallow Alignment while Leaving Partisan Structure Intact in a Large Language Model

🛡️AI Security Academic

CFCamo: A Counterfactual Detect-or-Abstain Framework for Camouflaged Object Detection

🛡️AI Security Academic

UNIQ: Conformal Calibration for Adaptive Conservatism in Offline Reinforcement Learning

🛡️AI Security Academic

Organize then Retrieve: Hierarchical Memory Navigation for Efficient Agents

🛡️AI Security Academic

Path Planning Using Deep Deterministic Policy Gradient: A Reinforcement Learning Approach

🛡️AI Security Academic

INFRAMIND: Infrastructure-Aware Multi-Agent Orchestration

🔧DevOps Academic

A Unifying Lens on Reward Uncertainty in RLHF

🎮Game Theory Academic

DrivingAgent: Design and Scheduling Agents for Autonomous Driving Systems

🏗️Systems Design Academic

Log in to enable infinite scrolling