🔍 Retrieval-augmented generation - pleto · Scour

IA-RAG: Interval-Algebra-Driven Temporal Reasoning for Dynamic Knowledge Retrieval

🧠Large Language Models (LLMs) Academic

SIFT: Selective-Index For Fast Compute of RAG Prefill by Exploiting Attention Invariance

💬Prompt optimizations for LLM serving Academic

Energy-Efficient On-Device RAG on a Mobile NPU: System Design and Benchmark on Snapdragon X Elite

📊AI Performance Profiling Academic

When More Documents Hurt RAG: Mitigating Vector Search Dilution with Domain-Scoped, Model-Agnostic Retrieval

🧠Large Language Models (LLMs) Academic

Document-Authored Control-Signal Impersonation: A Low-Cost Indirect Prompt Attack on RAG Safety Boundaries

💬Prompt optimizations for LLM serving Academic

TA-RAG: Tone-Aware Retrieval-Augmented Generation for Peer-Support Health Communication

🧠Large Language Models (LLMs) Academic

Tail-Aware Adaptive-k: Query-Adaptive Context Selection for Retrieval-Augmented Generation

🧠Large Language Models (LLMs) Academic

Anything2Skill: Compiling External Knowledge into Reusable Skills for Agents

🤖Agents using LLMs Academic

When Poison Fails After Retrieval: Revisiting Corpus Poisoning under Chunking and Reranking Pipelines

🧠Large Language Models (LLMs) Academic

MolE-RAG: Molecular Structure-Enhanced Retrieval-Augmented Generation for Chemistry

🧠Large Language Models (LLMs) Academic

EverydayGPT: Confidence-Gated Routing for Efficient and Safe Hybrid GPT-RAG Conversational QA

🧠Large Language Models (LLMs) Academic

TICoder: A Repository-Level Code Generation Framework with Test-Driven Planning and Implementation-Aware Reuse

🧠Large Language Models (LLMs) Academic

Reducing Hallucinations in Complex Question Answering using Simple Graph-based Retrieval-Augmented Generation (long version)

🧠Large Language Models (LLMs) Academic

TrustMargin: Training-Free Arbitration between Parametric Memory and Retrieved Evidence in Large Language Models

🧠Large Language Models (LLMs) Academic

NightFeats @ MMU-RAGent NeurIPS 2025: A Context-Optimized Multi-Agent RAG System for the Text-to-Text Track

🧠Large Language Models (LLMs) Academic

Beyond Probabilistic Similarity: Structural, Temporal, and Causal Limitations of Retrieval-Augmented Generation in the Legal Domain

🧠Large Language Models (LLMs) Academic

QCFuse: Query-Aware Cache Fusion via Compressed View for Efficient RAG Serving

🔧Systems-level optimizations for LLM serving Academic

uva-irlab-conv at SemEval-2026 Task 8: Multi-Turn RAG with Learned Sparse Retrieval and Listwise Reranking

🧠Large Language Models (LLMs) Academic

LongRTL: Graph-Similarity-Guided LLM-driven Long Context RTL Optimization

🔧Systems-level optimizations for LLM serving Academic

The Structural Attention Tax: How Retrieval Format Hijacks In-Context Learning Independent of Content

🧠Large Language Models (LLMs) Academic

Log in to enable infinite scrolling