🧠 LLM - yfff · Scour

One Step Closer to Ground Truth: A Multi-Scale Residual-Aware Representation Learning Pipeline for Predicting Time Series Data

🤖Transformers Academic

markusheimerl/gpt: A generative pretrained transformer implementation

🤖Transformers Code

github.com··Hacker News

What Do People Actually Want From AI? Mapping Preference Plurality

🤖AI Academic

Towards Tight Bounds for Streaming Attention

🤖Transformers Academic

Hasse Diagrams for Attention: A Partial Order Framework for Designing Transformer Masks

🤖Transformers Academic

Less-relevant results

DeepSeek Made AI Cheap. Now It Needs Billions to Keep It Cheap.

🚀Startups News Blog

chinacompany.substack.com··Substack

A Unifying Lens on Reward Uncertainty in RLHF

🎮Reinforcement Learning Academic

Operator Fusion for LLM Inference on the Tensix Architecture

🤖Transformers Academic

mingusb/transformer-golf: The Fully Unrolled Transformer: An experimental repository for architecture simplification and compilation. [2026]

🤖Transformers Code

github.com··Hacker News

Attention at the Theoretical Minimum: A Mathematics of Arrays Framework for Memory-Optimal Transformer Kernels

🤖Transformers Academic

Representation-Aware Advantage Estimation: Your Reward Model Provides More Than A Scalar Output

🎮Reinforcement Learning Academic

Magenta RealTime 2: Open and Local Live Music Models

🤖Transformers

magenta.withgoogle.com··Hacker News, Hacker News, r/LocalLLaMA

Principled Agent Debate: Adversarial Arbitration for Sycophancy Reduction in Large Language Models

🤖AI Academic

Hidden Consensus:Preference-Validity Compression in Human Feedback

🤖AI Academic

AttentionCap: Transformer Based Capacitance Matrix Learning Toward Full-Chip Extraction

🤖Transformers Academic

Learning from flowsheets: A generative transformer model for autocompletion of flowsheets

🤖Transformers Academic

Query-based Cross-Modal Projector Bolstering Mamba Multimodal LLM

🤖Transformers Academic

An Expanded Synthetic Conversation Dataset for Multi-Turn Smishing Detection

🤖Transformers Academic

Imbuing Large Language Models with Bidirectional Logic for Robust Chain Repair

🤖Transformers Academic

LazyAttention: Efficient Retrieval-Augmented Generation with Deferred Positional Encoding

🤖Transformers Academic

Log in to enable infinite scrolling