🔬 ML Research - lmilekic · Scour

What Makes a Desired Graph for Relational Deep Learning?

📚CS Research Academic

arxiv.org··Cited by 1 article

Boosting Direct Preference Optimization with Penalization

📚CS Research Academic

Fast and Highly Expressive Policy Learning for Offline Reinforcement Learning via Bootstrapped Flow Q-Learning

🎮Reinforcement Learning Academic

PAWS: Preference Learning with Advantage-Weighted Segments

📚CS Research Academic

Flatland: The Adventures of Gradient Descent with Large Step Sizes

📚CS Research Academic

Conformal Bayes under Label Shift: Post-Hoc Calibration vs. In-Training Adaptation

📚CS Research Academic

Different Layers, Different Manifolds: Module-Wise Weight-Space Geometry in Transformer Optimization

📚CS Research Academic

UNIQ: Conformal Calibration for Adaptive Conservatism in Offline Reinforcement Learning

🎮Reinforcement Learning Academic

I built a graph-memory layer on top of turbovec for local/constrained RAG — looking for feedback

🎨Creative Coding Code

github.com··r/LocalLLaMA

Learning-Augmented Approximation for Unrelated-Machines Makespan Scheduling

🎮Reinforcement Learning Academic

Preserving Plasticity in Continual Learning via Dynamical Isometry

📚CS Research Academic

ProcessThinker: Enhancing Multi-modal Large Language Models Reasoning via Rollout-based Process Reward

🎮Reinforcement Learning Academic

Spatiotemporal Imputation with Graph-Informed Flow Matching

📚CS Research Academic

Context-Driven Incremental Compression for Multi-Turn Dialogue Generation

📚CS Research Academic

arxiv.org··Cited by 1 article

nD-RoPE: A Generalized RoPE for n-Dimensional Position Embedding

📚CS Research Academic

In Defense of Information Leakage in Concept-based Models

📚CS Research Academic

Decoding Insect Song: A Multitask Semisupervised Orthoptera Bioacoustic Classifier

📚CS Research Academic

Minibatch Selection via Partition Matroid Constrained Gradient Matching

📚CS Research Academic

Tree-Structured Orthonormal Decomposition of the Aitchison Simplex

📚CS Research Academic

PianoKontext: Expressive Performance Rendering from Deadpan Context

📚CS Research Academic

Log in to enable infinite scrolling