📐 Optimization Theory - yfff · Scour

Flatland: The Adventures of Gradient Descent with Large Step Sizes

🧠Machine Learning Academic

Revisiting Privacy Amplification by Subsampling in Selective Release DPSGD

🧠Machine Learning Academic

Generalization in Deep Neural Networks: Minimax Rates for Gradient Methods

🧠Machine Learning Academic

Gridless Full-Space DOA Estimation for STAR-RIS-Assisted Wireless Systems

📶Communications Academic

A prism hierarchy of learning regimes in large linear autoencoders

🧠Machine Learning Academic

Noise-Adaptive High-Probability Regret Bounds for Online Convex Optimization

🎲Stochastic Processes Academic

Large-scale empirical tuning and comparison of default optimizers for variational inference

🔥PyTorch Academic

Lagrange multipliers in Maximum likelihood estimations and Least squares problems with Constraints

📊Statistics Academic

When Do Fewer Coordinates Suffice in DP-SGD?

🧠Machine Learning Academic

Adaptive directional gradients for parameterised quantum circuits

🧠Machine Learning Academic

ANCHOR: Autoregressive Non-intrusive Chunk-Ordered Refinement for Joint Multi-Resolution Speech Quality Modeling

📡Signal Processing Academic

Thresholded Local Hyper-Flow Diffusion

📉Loss Landscapes Academic

OptMuon: Closed-Loop Orthogonalized Momentum Methods for Stochastic Optimization with Zero-Noise Optimality

📐Semidefinite Programming Academic

Trace-Mediated Peak Bias: Bridging Temporal Credit Assignment and Cognitive Heuristics in Deep Reinforcement Learning

🎮Reinforcement Learning Academic

The Spectral Dynamics and Noise Geometry of Muon

🧠Machine Learning Academic

Improved Convergence Analysis of Topology Dependence in Decentralized SGD

📉Loss Landscapes Academic

Variational Proximal Policy Optimization

🎮Reinforcement Learning Academic

Low-Rank Decay for Grokking in Scale-Invariant Transformers: A Spectral-Geometric View

🤖Transformers Academic

On the conditional equivalence of phase retrieval algorithms

🧠Machine Learning Academic

Learning Dynamics Reveal a Hierarchy of Weight-Induced Layerwise Gram Metrics

🧠Machine Learning Academic

Log in to enable infinite scrolling