⚙️ Model Training - Bingran · Scour

Fine-tuning Multi-modal LLMs with ART: Art-based Reinforcement Training

📉Deep Learning Academic

If Claude Fable stops helping you, you’ll never know

simonwillison.net··Hacker News

RASFT: Rollout-Adaptive Supervised Fine-Tuning for Reasoning

💬LLMs Academic

Compatibility-Aware Dynamic Fine-Tuning for Large Language Models

🎮Reinforcement Learning Academic

PriFT: Prior-Support Guided Supervised Fine-Tuning

🎮Reinforcement Learning Academic

Data-Constrained Language Model Pretraining: Improved Regularization and Scaling Laws

💬LLMs Academic

Probabilistic Contrastive Pretraining for Multi-task ADME Property Prediction

💬LLMs Academic

MC-PDD: Masked Corpus-Level Pretraining Data Detection for Black-Box Large Language Models

💬LLMs Academic

Hubs or Fringes: Pretraining Data Selection via Web Graph Centrality

💬LLMs Academic

The Neutral Mask: How RLHF Provides Shallow Alignment while Leaving Partisan Structure Intact in a Large Language Model

💬LLMs Academic

Dominant-Layer ZO: A Single Layer Dominates Zeroth-Order Fine-Tuning of LLMs

🔍Interpretability Academic

Small Experiments, Cheaper Decisions: A Case Study in Staged Promotion for Micro-Pretraining

💬LLMs Academic

Multi-Hop Knowledge Composition is Bound by Pretraining Exposure

💬LLMs Academic

Architecture-Aware Reinforcement Learning Makes Sliding-Window Attention Competitive in Math Reasoning

🎮Reinforcement Learning Academic

Predictable Scaling Laws of Optimal Hyperparameters for LLM Continued Pre-training

💬LLMs Academic

CapRL++: Unified Reinforcement Learning with Verifiable Rewards for Dense Image and Video Captioning

🎮Reinforcement Learning Academic

Parameter-Efficient Adapter Tuning for Tabular-Image Multimodal Learning

🧠AI Research Academic

Multilevel Stochastic Gradient Descent for Risk-Averse PDE-Constrained Optimization

📉Deep Learning Academic

ActiveMimic: Egocentric Video Pretraining with Active Perception

💬LLMs Academic

When Probing Accuracy Saturates, Fragility Resolves: A Complementary Metric for LLM Pre-Training Analysis

💬LLMs Academic

Log in to enable infinite scrolling