🎮 Reinforcement Learning - pwadstrom · Scour

Reinforcement Learning and Optimal Control Book (RIP Dimitri Bertsekas)

✍️Prompt Engineering Academic

web.mit.edu··Hacker News

Agents Need Work Data: A Primer on RLWD, or Reinforcement Learning on Work Data

anjalishriva.com··Hacker News

Some Interesting Papers on RLVR

✍️Prompt Engineering

lesswrong.com·

AI-powered living business intelligence network

🗃️Database Optimization

atlasforgex.com

··Hacker News

Memoirs of a Learning Machine: Autobiographical Self-Training and the Self-Training Gap

✍️Prompt Engineering

zenodo.org··Hacker News

Propel: Breaking the Solver Bottleneck in Task-Generator RL

✍️Prompt Engineering

vmax.ai··Hacker News

A wild idea: Abstract reality using ontology

✍️Prompt Engineering Discussion

news.ycombinator.com··Hacker News

Researchers trained an open source AI search agent, Harness-1, that outperforms GPT-5.4 on recalling relevant information

venturebeat.com··Hacker News

You are here on the AI change curve

✍️Prompt Engineering

howfastis.ai··Hacker News, Hacker News

Arithmetic Pedagogy for Language Models

✍️Prompt Engineering Academic

arxiv.org··Hacker News

Beyond Dexterity: Why Contact May Define the Next Era of Robotics

✍️Prompt Engineering Video News

spectrum.ieee.org

··Hacker News

Why LLMs (still) lack taste

🚢DevOps Automation

beyondtheprior.com··Hacker News

I got so mad at poke(rogue)like that I trained a RL agent to beat it for me

🧠Machine Learning Blog

blog.thiagolira.com.br··Hacker News

Nvidia Nemotron 3 Ultra

⚙️AI Infrastructure

research.nvidia.com··Hacker News

Vibe Diaries: Training Nanochat

🧠Machine Learning

vibediary.dev··Hacker News

Agentic RL: Token-In, Token-Out Done Right

✍️Prompt Engineering

qgallouedec-tito.hf.space··Hacker News

See, Act, Correct: three levers for working with a code agent

🧠Claude Blog

blog.owulveryck.info··Hacker News, Hacker News

Apple's New AI Models Contain 'None' of Google's Gemini Assistant

🤖AI News

macrumors.com··Hacker News

LLM Research Papers: The 2026 List (January to May)

🧠AI Research News

magazine.sebastianraschka.com

··Hacker News

gaelazzo/python_chess: Chess trainer

🦀Rust Systems Code

github.com··Hacker News

Log in to enable infinite scrolling