🧠 Language Models - jinkai_lau · Scour

Carbon-Taxed Transformers: A Green Compression Pipeline for Overgrown Language Models 🧠LLMs

Differentially-Private Text Rewriting reshapes Linguistic Style 🧠LLMs

What Kind of Language is Easy to Language-Model Under Curriculum Learning? 🧠LLMs

Evaluating Temporal Consistency in Multi-Turn Language Models 🧠LLMs

A Multi-Dimensional Audit of Politically Aligned Large Language Models 🧠LLMs

A Survey on Split Learning for LLM Fine-Tuning: Models, Systems, and Privacy Optimizations 🧠LLMs

In-Sync: Adaptation of Speech Aware Large Language Models for ASR with Word Level Timestamp Predictions 🧠LLMs

Contextual Linear Activation Steering of Language Models 🧠LLMs

Marco-MoE: Open Multilingual Mixture-of-Expert Language Models with Efficient Upcycling 🧠LLMs

The Randomness Floor: Measuring Intrinsic Non-Randomness in Language Model Token Distributions 🧠LLMs

One Refiner to Unlock Them All: Inference-Time Reasoning Elicitation via Reinforcement Query Refinement 🧠LLMs

DGLight: DQN-Guided GRPO Fine-Tuning of Large Language Models for Traffic Signal Control 🧠LLMs

All That Glitters Is Not Audio: Rethinking Text Priors and Audio Reliance in Audio-Language Evaluation 🧠LLMs

Programming with Data: Test-Driven Data Engineering for Self-Improving LLMs from Raw Corpora 🧠LLMs

Why Does Reinforcement Learning Generalize? A Feature-Level Mechanistic Study of Post-Training in Large Language Models 🧠LLMs

Neural Network Optimization Reimagined: Decoupled Techniques for Scratch and Fine-Tuning 🔬AI Research

Parameter Efficiency Is Not Memory Efficiency: Rethinking Fine-Tuning for On-Device LLM Adaptation 🧠LLMs

The Override Gap: A Magnitude Account of Knowledge Conflict Failure in Hypernetwork-Based Instant LLM Adaptation 🧠LLMs

Compute Aligned Training: Optimizing for Test Time Inference 🧠LLMs

Scaling Properties of Continuous Diffusion Spoken Language Models 🧠LLMs

Sign up or log in to see more results

Log in to enable infinite scrolling