🎮 Q-Learning - liqihui02 · Scour

Q-Learning (Reinforcement learning): Bellman Equation, Markov Decision Processes, Q-Values, and…

🤖reinforcement learning, deep learning, machine learning Blog

·

Geometrically Averaged Hard Target Updates for Linear Q-Learning

🤖reinforcement learning, deep learning, machine learning Academic

Less-relevant results

DQN Tutorial - RL Summer School 2026

🤖recommendation systems, LLM, large langurage model

araffin.github.io·

Time-slip in AI sepsis models may inflate results, risking under- or overtreatment

✍️Prompt Engineering

medicalxpress.com·

Reward-learning algorithm hardwired into dopamine circuit

🤖reinforcement learning, deep learning, machine learning News

thetransmitter.org·

AI-powered living business intelligence network

🤖recommendation systems, LLM, large langurage model

atlasforgex.com

··Hacker News

Reinforcement Learning Disrupts Gradient-Based Adversarial Optimization

🤖reinforcement learning, deep learning, machine learning Academic

Space-sampled Value Decay: Forgetting Mechanisms for Non-stationary Deep Reinforcement Learning

🤖reinforcement learning, deep learning, machine learning Academic

Fast and Highly Expressive Policy Learning for Offline Reinforcement Learning via Bootstrapped Flow Q-Learning

🎯RLHF Academic

UNIQ: Conformal Calibration for Adaptive Conservatism in Offline Reinforcement Learning

🎯RLHF Academic

Development of COVID-19 Booster Vaccine Policy by Microsimulation and Q-learning

🤖reinforcement learning, deep learning, machine learning Academic

Performance Variation in Deep Reinforcement Learning

🤖reinforcement learning, deep learning, machine learning Academic

Event-Driven Reinforcement Learning Enables Long-Horizon Control in Semiconductor Fabrication

🤖reinforcement learning, deep learning, machine learning Academic

Discovering Interpretable Multi-Parameter Control Policies for Evolutionary Algorithms Using Deep Reinforcement Learning

🤖reinforcement learning, deep learning, machine learning Academic

Constrained Deep Reinforcement Learning for Cognitive Radar Resource Management

🤖reinforcement learning, deep learning, machine learning Academic

ARTA: Adaptive Reinforcement-Learning-Based Throttling Agent for RowHammer Vulnerabilities

✍️Prompt Engineering Academic

Quantum-Inspired Reinforcement Learning for Low-Latency Intrusion Detection in V2X and Internet-of-Vehicles Networks

🤖reinforcement learning, deep learning, machine learning Academic

Fast and Robust Convergence Rate for TD(0) with Linear Function Approximation, Universal Learning Steps and I.I.D. Samples

🤖reinforcement learning, deep learning, machine learning Academic

Self-evolving LLM agents with in-distribution Optimization

🎯RLHF Academic

Spatially Selective Self-Training for Unsupervised Building Change Detection

✍️Prompt Engineering Academic

Log in to enable infinite scrolling