📈 Optimization - saeedesmaili · Scour

Variational Proximal Policy Optimization

🎮Reinforcement Learning Academic

ml-from-scratch-book/code: Companion code for Machine Learning From Scratch — 10 core ML algorithms built from scratch with NumPy, compared with Scikit-learn and PyTorch.

🤖Machine Learning Code

github.com··Hacker News

Gram Newton-Schulz: A Fast, Hardware-Aware Newton-Schulz Algorithm for Muon

⚡CUDA Blog

tridao.me··Hacker News

Ultrafast machine learning on FPGAs via Kolmogorov-Arnold Networks

🧠Neural Networks

aarushgupta.io··Lobsters, Hacker News

Optimal Rates for Generalization of Gradient Descent Methods with Deep Neural Networks

🔬Deep Learning Academic

Finding Optimal Tokenizers

🔤Tokenization Blog

blog.aqnichol.com··Hacker News

Capacity-Constrained Online Convex Optimization with Delayed Feedback

🎮Reinforcement Learning Academic

Less-relevant results

The Untrainable

🎯Fine-tuning News Blog

saranormous.substack.com··Substack

Second-Order Path Kernel Interpolation Formulas in Machine Learning

🤖Machine Learning Academic

Designing Loops That Prompt Coding Agents: The Six I Actually Run

📞Function Calling

cameronwestland.com··Hacker News

Simplicity Suffices for Parameter Noise Injection in Stochastic Gradient Descent

🤖Machine Learning Academic

Growing Pains of Starting a Secret Society

🌱Digital Gardens Blog

mrmarket.bearblog.dev··Hacker News

Uniform Stability and Generalization Error of GD and SGD on Fixed-Point Parameters

🎮Reinforcement Learning Academic

Last-Iterate Convergence of Optimistic Multiplicative Weight Update

🎮Reinforcement Learning Academic

Mirror Descent Beyond Euclidean Stability: An Exponential Separation in Initialization Sensitivity

🎮Reinforcement Learning Academic

Flatland: The Adventures of Gradient Descent with Large Step Sizes

🤖Machine Learning Academic

Fixed-Parameter Tractability of Private Synthetic Data Generation

🧠LLM Inference Academic

Gradient descent at the Edge of Stability: free energy model and kinetic description of the two-layer network

🤖Machine Learning Academic

Noise-Adaptive High-Probability Regret Bounds for Online Convex Optimization

🎮Reinforcement Learning Academic

LieIPM: Lie Group Interior Point Method for Direct Trajectory Optimization of Rigid Bodies

🎮Reinforcement Learning Academic

Log in to enable infinite scrolling