⚡ Apache Spark - cherisher5765 · Scour

When AI builds itself 👷, AI is not a line item 📝, local LLMs for agentic coding 🤖

Build stateful streaming applications with Apache Spark 4.0 on Amazon EMR Serverless

🔄Data Pipelines Blog

aws.amazon.com·

Operationalizing Property-Based Testing for Data-Intensive Scalable Computing Systems

🔄Data Pipelines Academic

RATrain: A Resource-Aware Training Runtime for Large Language Models on Bandwidth-Constrained Heterogeneous Supercomputing Platforms

🔄Data Pipelines Academic

Run Interactive Workloads on Amazon EMR Serverless with Spark Connect

🔄Data Pipelines

·

ASTRA-sim 3.0: Next-Level Distributed Machine Learning Simulations via High-Fidelity GPU and Infrastructure Modeling

🔄Data Pipelines Academic

Achieving Cloud-Grade SLOs for Local Mixture-of-Experts Inference through CPU-GPU Hybrid Design

🔄Data Pipelines Academic

Update canonical GitHub project links (#3177)

🐍Python Code

FairWave : A Fairness-Aware Asynchronous DAG-BFT Consensus

🔄Data Pipelines Academic

FlashCP: Load-Balanced Communication-Efficient Context Parallelism for LLM Training

🔄Data Pipelines Academic

Generalizing LCL Complexity Gaps to Unbounded Degree via Monadic Second-Order Properties

🛠️Data Engineering Academic

Terastal: Layer-Variant-based Scheduling for Real-Time Multi-DNN Workloads on Heterogeneous Accelerators

🔄Data Pipelines Academic

Rectangular Matrix Multiplication in the Low-Bandwidth Model

🛠️Data Engineering Academic

Engineering Scalable Distributed List Ranking

🛠️Data Engineering Academic

aayush4vedi/drift-spark: Spark-native embedding lifecycle- produce, CDC refresh, model-migrate, audit.

🔄Data Pipelines Code

github.com··Hacker News

When More Cores Hurts: The Vector Database Scaling Paradox in HPC

🔄Data Pipelines Academic

Resource-aware Computation-Communication Overlap for multi-GPU ML Workloads

🔄Data Pipelines Academic

IN2P3 Computing Center 2024 Workload Dataset

🔄Data Pipelines Academic

AutoPilot: Learning to Steer High Speed Robust BFT

🔄Data Pipelines Academic

Demystifying NVSHMEM: A System-Level Analysis on Symmetric Memory and Device-Initiated Operations in GPU Communication

🔄Data Pipelines Academic

Log in to enable infinite scrolling