🎨 Generative AI - nate_dkz · Scour

Kingdom Hearts IV is coming to Switch 2, PlayStation 5, Xbox Series X, and PC

🎨Generative Art

Video-Rate Streaming Stylization on a Vision-Aware MLLM-Conditioned Edit Diffusion: Asymmetric Batched Inference on a Distilled UNet + MLLM Text Encoder

💬Natural Language Processing Academic

BLM-SGAN: Bidirectional Language Modeling for Semantic-Spatial Text-to-Image Generation

💬Natural Language Processing Academic

Breaking the Lock-in: Diversifying Text-to-Image Generation via Representation Modulation

👁️Multimodal AI Academic

Seeing is Believing: Aligning Prompt Rewriting with Visual Anchors for Text-to-Image Generation

💬Prompt Engineering Academic

STEDiff: Strengthening Text Embedding for Text-to-Image Alignment in Diffusion Model

👁️Multimodal AI Academic

NutriMLLM: Multimodal Large Language Models for Dietary Micronutrient Analysis

👁️Multimodal AI Academic

Faithful, Enriched, and Precise: Benchmarking Natural-Science Illustration Generation by T2I models

👁️Multimodal AI Academic

Customization under Fire: Plugin Poisoning in Text-to-Image Ecosystem

🚀Indie Hacking Academic

ZIPP:Zero-shot Image Personalization from Personas

👁️Multimodal AI Academic

Can We Predict The Human Preference For Text-to-Image Content Prior To Generation And Is It Even Useful To Do So?

🎨Generative Art Academic

Late-Layer Fusion is Enough: Dual-Path Vision Token Routing for Multimodal Large Language Models under Visual Saturation

👁️Multimodal AI Academic

Conditional Vendi Score: Prompt-Aware Diversity Evaluation for Generative AI Models and LLMs

💻Operating Systems Academic

sketch-plot: Progressive Editing for Text-to-Image Academic Figures

👁️Multimodal AI Academic

Assessing the Geographic Diversity of AI's Platial Representations in Image Generation

👁️Multimodal AI Academic

Consistent-Inversion: Reverse Consistency Guidance for Structure-Preserving Visual Editing

🤖AI Tools Academic

EditSSC: Toward Editable Semantic Occupancy Scenes with Unconditional Diffusion Models

🤖AI Tools Academic

Beyond Scalar Rewards by Internalizing Reasoning into Score Distributions

👁️Multimodal AI Academic

Can You Trust What You See? Human and AI Detection of Synthetic Legal Evidence

♊Gemini Academic

OmniGen-AR: AutoRegressive Any-to-Image Generation

🎨Generative Art Academic

Log in to enable infinite scrolling