🎮 Reinforcement Learning - lmilekic · Scour

Q-Learning (Reinforcement learning): Bellman Equation, Markov Decision Processes, Q-Values, and…

📊LLM Evaluation Blog

·

Reinforcement Learning and Optimal Control Book (RIP Dimitri Bertsekas)

🦾Robotics Academic

web.mit.edu··Hacker News

Geometry-Aware Reinforcement Learning for 2D Irregular Nesting

🦾Motion Planning Academic

Some Interesting Papers on RLVR

lesswrong.com·

Reasoning RL in 2026: GRPO, DPO, RLVR, Agentic PO & Beyond

turingpost.com·

Agents Need Work Data: A Primer on RLWD, or Reinforcement Learning on Work Data

anjalishriva.com··Hacker News

Good teachers don’t cheat

🧠LLMs Blog

jasonkena.github.io··Hacker News

SimarcLabs/pybullet-swarm-sim: Python framework for simulating drone swarms with PyBullet in seconds.

🦾Robotics Code

github.com··r/opensource

Scale Robot Reinforcement Learning with NVIDIA Isaac Lab on Amazon SageMaker AI

🦾Robotics Blog

aws.amazon.com·

DDPG from Scratch: 400-Line PyTorch Implementation

AI Agent Mastery & Coaching

Agentic RL: Token-In, Token-Out Done Right

⚙️Prompt Engineering

qgallouedec-tito.hf.space··Hacker News

Performance Variation in Deep Reinforcement Learning

📊LLM Evaluation Academic

Cohere open-sources a coding agent that runs on a single H100

venturebeat.com·

NVIDIA Nemotron 3 Ultra Powers Faster, More Efficient Reasoning for Long-Running Agents

📊LLM Evaluation Blog

developer.nvidia.com··Hacker News

How to Train Your Goblin

goblins.mchen.workers.dev··Hacker News, Hacker News

See, Act, Correct: three levers for working with a code agent

🧠LLMs Blog

blog.owulveryck.info··Hacker News, Hacker News

Social intelligence Arises Between Minds

📚CS Research

psychologytoday.com·

Microsoft just shared the frontier data engineering secrets

⚙️Prompt Engineering

mail.bycloud.ai·

Deep reinforcement learning for process design: Review and perspective

✨Generative AI Academic

Log in to enable infinite scrolling