🎯 Fine-Tuning - jhcha.oyo · Scour

Parameter-Efficient Fine-Tuning with Learnable Rank

🎛️Fine-tuning Academic

Measuring Embedding Drift: Why Hybrid Search Saves Stale Models.

🎛️Fine-tuning

pub.towardsai.net

·

Tracing Eval-Awareness Emergence Through Training of OLMo 3

🎛️Fine-tuning

lesswrong.com·

Five Ways to Fine-Tune Chronos-2, the Time Series Foundation Model

🎛️Fine-tuning

towardsdatascience.com·

The Neutral Mask: How RLHF Provides Shallow Alignment while Leaving Partisan Structure Intact in a Large Language Model

🎯RLHF Academic

The Fine-Tuning Trap: Evaluating Negative Transfer and the Role of PEFT in Sub-1B Mathematical Reasoning

🎛️Fine-tuning Academic

Fine-tuning vs RAG vs MeMo: Where should LLM Knowledge Live?

🎛️Fine-tuning

pub.towardsai.net

·

Which LoRA? An Empirical Study on the Effectiveness of LoRA Techniques During Multilingual Instruction Tuning

🎛️Fine-tuning Academic

How to Fine-Tune an SLM for Emotion Recognition

🎛️Fine-tuning

towardsdatascience.com·

Auditing Training Data in Domain-adapted LLMs: LoRA-MINT

🎛️Fine-tuning Academic

Instruction Finetuning DeepSeek-R1-8B Model Using LoRA and NEFTune

🎛️Fine-tuning Academic

Multilingual Refusal Alignment for Safer Large Language Models

🎯RLHF Academic

Small Data, Big Noise: Adversarial Training for Robust Parameter-Efficient Fine-Tuning

🎛️Fine-tuning Academic

TALAN: Task-Aligned Latent Adaptation Networks for Targeted Post-Training of Large Language Models

🎛️Fine-tuning Academic

Mult-DPO: Multinomial Direct Preference Optimization for Recommender Systems

🎯RLHF Academic

Alignment Defends LLMs from Property Inference Attacks

🎛️Fine-tuning Academic

DOG-DPO:Dynamic Optimization in Geometry for Safety Alignment

🎛️Fine-tuning Academic

Recoverable but Not Stationary:Local Linear Structures in Weights and Activations

🎛️Fine-tuning Academic

Multilingual Sentiment Aware Text Summarization A Reinforcement Learning Approach for Consistency Maintenance

🎯RLHF Academic

PEFT of SLM for Telecommunications Customer Support: A Comparative Study of LoRA Configurations with Energy Consumption Analysis

🎛️Fine-tuning Academic

Log in to enable infinite scrolling