🌀 Diffusion Models - zhengjinyuan0525 · Scour

Latent Diffusion Policy: Shaping Latent Spaces for Diffusion-Based Robotic Manipulation

🤖Embodied AI Academic

Continuous Language Diffusion as a Decoder-Interface Problem

🔀Multimodal AI Academic

ARAPDiffusion: ARAP Regularization for Diffusion-Based Deformable Shape Space Learning

👁️Computer Vision Academic

Less-relevant results

Spectrally Regularized Latent Flow Matching for Turbulence Generation

🫧Gaussian Splatting Academic

Holding the FP8 Quality Ceiling at 8-Bit Weights and Activations: INT8 and GGUF Post-Training Quantization of Ideogram 4.0 for Consumer GPUs

✨NeRF Academic

Diffusion Models for Adaptive Sequential Data Generation

🧊3D Generation Academic

Echo-DM: Ultrasound Marker Removal via Conditional Latent Diffusion and Region-Aware Fusion

👁️Computer Vision Academic

HyFAD: Hybrid Time-Frequency Diffusion with Frequency-Aware Embedding for Time Series Imputation

🗂️Semantic Segmentation Academic

No Free Lunch for Synthetic Images under Data Scarcity Conditions

👁️Computer Vision Academic

The Score Hamiltonian: Mapping Diffusion Models to Adiabatic Transport

🫧Gaussian Splatting Academic

Show HN: Magenta Real-Time Music Generation on iPhone, Without the GPU

🧊3D Generation Code

github.com··Hacker News

Consistent-Inversion: Reverse Consistency Guidance for Structure-Preserving Visual Editing

👁️Computer Vision Academic

Anchor-Conditioned Compositional Control for Landscape Image Generation

👁️Computer Vision Academic

Flash-WAM: Modality-Aware Distillation for World Action Models

👁️Computer Vision Academic

Test-time Adversarial Takeover: A Real-time Hijacking Interface against Robotic Diffusion Policies

🤖Embodied AI Academic

NSVQ: Mitigating Codebook Collapse by Stabilizing Encoder Drift in Vector Quantization

👁️Computer Vision Academic

STREAM: Stochastic Riemannian Flow Matching with Anisotropic Decoder for Digital Histopathology Image Generation

👁️Computer Vision Academic

Mean Flow Distillation: Robust and Stable Distillation for Flow Matching Models

👁️Computer Vision Academic

tetherto/qvac: QVAC - Local AI SDK and libraries for building private, cross-platform, peer-to-peer AI applications. Run LLMs, speech-to-text, translation, and more locally on Linux, macOS, Windows, Android, and iOS.

🔀Multimodal AI Code

Speech Meets ELF: Audio Conditional Continuous-Target Diffusion for Speech Recognition and Translation

🔀Multimodal AI Academic

Sign up or log in to see more results

Log in to enable infinite scrolling