🧠 Large Language Models (LLMs) - pleto · Scour

The Neutral Mask: How RLHF Provides Shallow Alignment while Leaving Partisan Structure Intact in a Large Language Model

✨Model optimizations in LLMs Academic

Train Models Faster with JAX and MaxText Using NVFP4 on NVIDIA Blackwell

✨Model optimizations in LLMs News Blog

developer.nvidia.com·

Should LLM Agents Decide in Social Simulations? Comparing Finite-State and LLM-Based Decision Policies

🤖Agents using LLMs Academic

Acoda: Adversarial Code Obfuscation for Defending against LLM-based Analysis

🔧Systems-level optimizations for LLM serving Academic

Causal Semantic Alignment for LLM-based Time Series Forecasting

✨Model optimizations in LLMs Academic

LANTERN: Layered Archival and Temporal Episodic Retrieval Network for Long-Context LLM Conversations

🔍Retrieval-augmented generation Academic

Benchmarking Large Language Models for Safety Data Extraction

✨Model optimizations in LLMs Academic

Hallucination Cascade: Analyzing Error Propagation in Multi-Agent LLM Systems

🤖Agents using LLMs Academic

Analyzing the Correlation Between Hallucinations and Knowledge Conflicts in Large Language Models

🔍Retrieval-augmented generation Academic

CRUMB: Efficient Prior Fitted Network Inference via Distributionally Matched Context Batching

📊AI Performance Profiling Academic

LLMCodec: Adapting Video Codecs for Efficient Weight Compression of Large Language Models

✨Model optimizations in LLMs Academic

Shared Latent Structures Enable Unified Backdoor Detection and Mitigation in LLMs

🔧Systems-level optimizations for LLM serving Academic

PermDoRA -- Understanding Adapter Interference in Language Models: Limits of Parameter-Space Geometry

📊AI Performance Profiling Academic

Minimizing the Hidden Cost of Scales: Graph-Guided Ultra-Low-Bit Quantization for Large Language Models

✨Model optimizations in LLMs Academic

MechLens: Late Crystallization of Factual Knowledge Explains Intervention Effectiveness in Language Models

🔍Retrieval-augmented generation Academic

Multi-Agent Reasoning with Adaptive Worker Allocation for Stance Detection

⚡Real-time AI Systems Academic

A retrieval conditioned rebinding circuit for dynamic entity tracking in large language models

🔍Retrieval-augmented generation Academic

Making Locality-aware GEMM Compatible with Page-Granularity Placement on Chiplet GPUs

📊AI Performance Profiling Academic

Domain-Adapted Small Language Models with Hybrid Post-Processing: Achieving Cost-Efficient, Low-Latency Multi-Label Structured Prediction via LoRA Fine-Tuning on Scarce Data

✨Model optimizations in LLMs Academic

BUDDY: BUdget-Driven DYnamic Depth Routing for Adaptive Large Language Model Inference

🔧Systems-level optimizations for LLM serving Academic

Log in to enable infinite scrolling