🎮 Reinforcement Learning - pwadstrom · Scour

Reinforcement Learning and Optimal Control Book (RIP Dimitri Bertsekas)

🧠AI Research Academic

web.mit.edu··Hacker News

Agents Need Work Data: A Primer on RLWD, or Reinforcement Learning on Work Data

🧠AI Research

anjalishriva.com··Hacker News

Some Interesting Papers on RLVR

🧠AI Research

lesswrong.com·

AI-powered living business intelligence network

🧠AI Research

atlasforgex.com

··Hacker News

Memoirs of a Learning Machine: Autobiographical Self-Training and the Self-Training Gap

🧠AI Research

zenodo.org··Hacker News

Propel: Breaking the Solver Bottleneck in Task-Generator RL

🧠AI Research

vmax.ai··Hacker News

A wild idea: Abstract reality using ontology

✍️Prompt Engineering Discussion

news.ycombinator.com··Hacker News

Researchers trained an open source AI search agent, Harness-1, that outperforms GPT-5.4 on recalling relevant information

venturebeat.com··Hacker News

You are here on the AI change curve

✍️Prompt Engineering

howfastis.ai··Hacker News, Hacker News

Arithmetic Pedagogy for Language Models

🧠AI Research Academic

arxiv.org··Hacker News

Beyond Dexterity: Why Contact May Define the Next Era of Robotics

🧠AI Research Video News

spectrum.ieee.org

··Hacker News

Why LLMs (still) lack taste

🧠AI Research

beyondtheprior.com··Hacker News

I got so mad at poke(rogue)like that I trained a RL agent to beat it for me

🧠AI Research Blog

blog.thiagolira.com.br··Hacker News

Nvidia Nemotron 3 Ultra

🧠AI Research

research.nvidia.com··Hacker News

Vibe Diaries: Training Nanochat

🧠Machine Learning

vibediary.dev··Hacker News

Agentic RL: Token-In, Token-Out Done Right

🧠AI Research

qgallouedec-tito.hf.space··Hacker News

See, Act, Correct: three levers for working with a code agent

🧠Claude Blog

blog.owulveryck.info··Hacker News, Hacker News

Apple's New AI Models Contain 'None' of Google's Gemini Assistant

🧠AI Research News

macrumors.com··Hacker News

LLM Research Papers: The 2026 List (January to May)

🧠AI Research News

magazine.sebastianraschka.com

··Hacker News

gaelazzo/python_chess: Chess trainer

🧠AI Research Code

github.com··Hacker News

Log in to enable infinite scrolling