🏗️ Hardware Architecture - widget101 · Scour

KV Cache Optimization — Why Inference Memory Explodes and How to Fix It

dev.to·6d·

Discuss: DEV

💾Cache Optimization

Heterogeneous Processing: A Strategy for Augmenting Moore's Law (2006)

linuxjournal.com·4d·

Discuss: Hacker News

⚡SIMD Optimization

KV-CoRE: Benchmarking Data-Dependent Low-Rank Compressibility of KV-Caches in LLMs

arxiv.org·6d

💾Cache Optimization

Hello Edge: Keyword Spotting on Microcontrollers

paperium.net·6d·

Discuss: DEV

📊Columnar Engines

AI Inference Needs A Mix-And-Match Memory Strategy

semiengineering.com·18h

📊Columnar Engines

Benchmarking Claude C Compiler

dineshgdk.substack.com·2d·

Discuss: Substack, r/programming

⚙️Query Compilers

TimelyFreeze: Adaptive Parameter Freezing Mechanism for Pipeline Parallelism

arxiv.org·6d

📊Columnar Engines

AI in Multiple GPUs: Understanding the Host and Device Paradigm

towardsdatascience.com·13h

📈Performance Profiling

Minimum Energy Per Query

semiengineering.com·18h

💾Cache Optimization

Supercharging Inference for AI Factories: KV Cache Offload as a Memory-Hierarchy Problem

blog.min.io·11h

📊Columnar Engines

Concurrency Design Patterns: From Fundamental Theory to Architecture

dev.to·4d·

Discuss: DEV

🔄Concurrency

I Built a 6 BIPS JIT in Five Months

unlikelyemphasis.substack.com·6d·

Discuss: Substack

📊Columnar Engines

How to Design Systems That Actually Scale? Think Like a Senior Engineer

javarevisited.substack.com·4d·

Discuss: r/programming

☁️AWS Infrastructure

Cache is king and DIMMS are bling as memory prices soar

theregister.com·3d

💾Cache Optimization

AVX2 SIMD Optimization for 12-bit JPEG Decoding in libjpeg-turbo — Pair Programming with Copilot CLI

github.com·2d·

Discuss: DEV

⚡SIMD Optimization

Show HN: Model Training Memory Simulator

czheo.github.io·4d·

Discuss: Hacker News

🧠Memory Management

Anubis OSS — Local LLM Benchmarking for Apple Silicon

devpadapp.com·3d·

Discuss: r/opensource

📈Performance Profiling

Neuromorphic photonic computing with an electro-optic analog memory

nature.com·5d

💡Optical Computing

Creeping memory allocation

community.folivora.ai·4d

🧠Memory Management

Zero State Architecture deep dive

news.ycombinator.com·9h·

Discuss: Hacker News

💾Cache Optimization

Loading more...