📉 Deep Learning - Bingran · Scour

Variational Proximal Policy Optimization

🎮Reinforcement Learning Academic

Mirror Descent Beyond Euclidean Stability: An Exponential Separation in Initialization Sensitivity

🎮Reinforcement Learning Academic

Pretraining Recurrent Networks without Recurrence

⚙️Model Training Academic

Constrained Paraphrase Consistency for LLM Hallucination Detection

⚙️Model Training Academic

Perturbative Contrastive Physical Learning

⚙️Model Training Academic

Uniform Stability and Generalization Error of GD and SGD on Fixed-Point Parameters

⚙️Model Training Academic

Reinforcement Learning for Flow-Matching Policies with Density Transport

🎮Reinforcement Learning Academic

A prism hierarchy of learning regimes in large linear autoencoders

⚙️Model Training Academic

Adaptive directional gradients for parameterised quantum circuits

⚙️Model Training Academic

Quantifying Uncertainty In Wide Two-Layer Neural Networks: On The Law Of The Limiting Fluctuation Process

⚙️Model Training Academic

vla.cpp: A Unified Inference Runtime for Vision-Language-Action Models

🔥PyTorch Academic

Gradient Descent with Large Step Size Restores Symmetry in Deep Linear Networks with Multi-Pathway

🧠AI Research Academic

The Spectral Dynamics and Noise Geometry of Muon

⚙️Model Training Academic

Characterizing Learning Dynamics under Relative Reparameterization of Singular Models

⚙️Model Training Academic

DP-MacAdam: Differentially Private Mechanism with Adaptive Clipping and Adaptive Momentum

⚙️Model Training Academic

nnAudio 2: Overcoming Dynamic Compilation Barriers and Transform Inconsistencies

🔥PyTorch Academic

PC Layer: Polynomial Weight Preconditioning for Improving LLM Pre-Training

⚙️Model Training Academic

Uncovering Extreme Event Mechanisms for Prediction and Control with Sensitivity-Balanced Projections

⚙️Model Training Academic

Q-VGM: Q-Guided Value-Gradient Matching for Flow-Matching VLA Policies

🎮Reinforcement Learning Academic

Beyond Linear and Overcomplete Regimes: A Mean-Field Analysis of Bottleneck Autoencoders

⚙️Model Training Academic

Log in to enable infinite scrolling