🌊 CUDA Streams - miterion · Scour

Advanced GPU Optimization: CUDA & HIP from zero to hero

dev.to·39m·

Discuss: DEV

⚡CUDA Programming Patterns

AI in Multiple GPUs: Point-to-Point and Collective Operations

towardsdatascience.com·1d

Mesa 26.0: RADV catapults Radeon ray tracing forward on Linux

igorslab.de·12h

Breaking the Tractability Barrier: A Generic Low-Level Solver for NP-Hard Instances (N=63) on Commodity 64-Bit Silicon

zenodo.org·1d·

Discuss: r/programming

Execution-Centric Characterization of FP8 Matrix Cores, Asynchronous Execution, and Structured Sparsity on AMD MI300A

arxiv.org·2d

📈Occupancy Optimization

AI in Multiple GPUs: Understanding the Host and Device Paradigm

towardsdatascience.com·2d

⏱️CUDA Events

Show HN: Toil, a go library for simple parallelism

github.com·1d·

Discuss: Hacker News

⚡CUDA Programming Patterns

Running Async WebAssembly on Seastar's Reactor

rockwotj.com·1h·

Discuss: Hacker News

⏱️CUDA Events

CUDA Shared Memory Bank Conflict-Free Vectorized Access

leimao.github.io·1d

🎛️CUDA Optimization

Distributed Training Across Mixed GPUs: Solving the Heterogeneous Fleet Problem

shardpool.aurora-sentient.net·5h·

Discuss: DEV

Advanced GPU Optimization: Metal & Vulkan Compute from zero to hero

dev.to·21m·

Discuss: DEV

🎯GPU Kernels

Show HN: Skill that lets Claude Code/Codex spin up VMs and GPUs

news.ycombinator.com·3h·

Discuss: Hacker News

🤖AI Coding Tools

Beyond Latency and Communication Complexity - A Tutorial on the Pipes Model

decentralizedthoughts.github.io·1d

⚡CUDA Programming Patterns

Intel expands XeSS multi-frame generation to Battlemage, Alchemist GPUs and more

neowin.net·1h

Compositionality of Systems and Partially Ordered Runs

arxiv.org·1d

⚡CUDA Programming Patterns

Micron’s Early HBM4 Ramp Tests Durability Of AI Memory Boom

finance.yahoo.com·5h

⚡Flash Attention

Advanced GPU Optimization: Metal & Vulkan Compute from zero to hero

vulkan.lunarg.com·24m·

Discuss: DEV

⚡CUDA Programming Patterns

OpenAI GPT-5.3-Codex-Spark Now Running at 1K Tokens Per Secondon BIG Cerebras Chips

servethehome.com·23h·

Discuss: Hacker News

⚡Flash Attention

Introduction To Concurrency | Concurrency Interview | AlgoMaster.io

algomaster.io

·3d

⚡CUDA Programming Patterns

Radeon Vega lives on, Acemagic N3A NAS launches with Ryzen 7 3750H “Picasso” APU

videocardz.com·6h

📈GPU Occupancy

Loading more...