🎨 Generative AI - codenm.no2 · Scour

UniCanvas: A Diffusion-base Unified Model for Text-in-Image Joint Generation

👁️Multimodal AI Academic

How Image Generation Actually Works

🎲Procedural Generation

pub.towardsai.net

·

Evaluating the Representation Space of Diffusion Models via Self-Supervised Principles

👁️Multimodal AI Academic

Data assimilation for subsurface flow using latent diffusion model parameterization: performance of ensemble-Kalman and Monte Carlo techniques

🎲Bayesian Inference Academic

TrioPose: Native Triple-Stream Diffusion Transformers for Pose-Guided Text-to-Image Generation

👁️Multimodal AI Academic

Optimality of FSQ Tokens for Continuous Diffusion for Categorical Data with Application to Text-to-Speech

🧠LLM Academic

Unified Safe In-context Image Generation in Multimodal Diffusion Transformers via Restricting Unsafe Information Flows

🔐Cryptography Academic

Efficient and Training-Free Single-Image Diffusion Models

👁️Multimodal AI Academic

arxiv.org··Hacker News

NutriMLLM: Multimodal Large Language Models for Dietary Micronutrient Analysis

👁️Multimodal AI Academic

Late-Layer Fusion is Enough: Dual-Path Vision Token Routing for Multimodal Large Language Models under Visual Saturation

👁️Multimodal AI Academic

Diffusion Models for Adaptive Sequential Data Generation

🛡️Privacy Engineering Academic

STREAM: Stochastic Riemannian Flow Matching with Anisotropic Decoder for Digital Histopathology Image Generation

🎲Procedural Generation Academic

Geometry-Aware Dataset Condensation for Diffusion Model Training

🛡️Privacy Engineering Academic

BLM-SGAN: Bidirectional Language Modeling for Semantic-Spatial Text-to-Image Generation

💬NLP Academic

FreeAnimate: Training-Free Human Image Animation with Preview-Guided Denoising

👁️Multimodal AI Academic

Where Should Knowledge Enter? A Layered Framework for Knowledge Infusion in Multimodal Iterative Generative Mo

📚Content Curation Academic

Less Is More: Training-Free Acceleration Framework of 3D Diffusion Models for Low-Count PET Denoising via Global-Local Trajectory Reduction

🤖LLM Inference Academic

The Invisible Hand of Physics: When Video Diffusion Models Know More Than They Show

👁️Multimodal AI Academic

Seeing is Believing: Aligning Prompt Rewriting with Visual Anchors for Text-to-Image Generation

🧠LLM Academic

ZIPP:Zero-shot Image Personalization from Personas

🧠LLM Academic

Log in to enable infinite scrolling