🔍 Grad-CAM - upchuck5372 · Scour

I Taught an AI to Dream

blog.minibase.ai·7h·

Discuss: Hacker News

Flag this post

Validating Deep Models for Alzheimer's 18F-FDG PET Diagnosis Across Populations: A Study with Latin American Data

arxiv.org·18h

👁️Vision Transformers

Flag this post

Bayesian Natural Gradient Fine-Tuning of CLIP Models via Kalman Filtering

arxiv.org·18h

🤖Machine learning

Flag this post

A Practitioner's Guide to Kolmogorov-Arnold Networks

arxiviq.substack.com·2d·

Discuss: Substack

Flag this post

The Curvature Rate {\lambda}: A Scalar Measure of Input-Space Sharpness in Neural Networks

arxiv.org·18h

👁️Vision Transformers

Flag this post

Explore More, Learn Better: Parallel MLLM Embeddings under Mutual Information Minimization

arxiv.org·18h

🤖Machine learning

Flag this post

Latent Domain Prompt Learning for Vision-Language Models

arxiv.org·18h

Flag this post

Visual Backdoor Attacks on MLLM Embodied Decision Making via Contrastive Trigger Learning

arxiv.org·1d

Flag this post

OmniBrainBench: A Comprehensive Multimodal Benchmark for Brain Imaging Analysis Across Multi-stage Clinical Tasks

arxiv.org·18h

Flag this post

VLM6D: VLM based 6Dof Pose Estimation based on RGB-D Images

arxiv.org·18h

🔺Geometric Learning

Flag this post

R²D²: Perception-Guided Task & Motion Planning for Long-Horizon Manipulation

developer.nvidia.com·1d

🔺Geometric Learning

Flag this post

A Hybrid Deep Learning and Forensic Approach for Robust Deepfake Detection

arxiv.org·1d

Flag this post

SciTextures: Collecting and Connecting Visual Patterns, Models, and Code Across Science and Art

arxiv.org·18h

Flag this post

FOCUS: Efficient Keyframe Selection for Long Video Understanding

arxiv.org·1d

Flag this post

A filtering scheme for confocal laser endomicroscopy (CLE)-video sequences for self-supervised learning

arxiv.org·18h

🔺Geometric Learning

Flag this post

Diagnosing Hallucination Risk in AI Surgical Decision-Support: A Sequential Framework for Sequential Validation

arxiv.org·18h

Flag this post

FreeSliders: Training-Free, Modality-Agnostic Concept Sliders for Fine-Grained Diffusion Control in Images, Audio, and Video

arxiv.org·18h

Flag this post

Text-guided Fine-Grained Video Anomaly Detection

arxiv.org·18h

👁️Vision Transformers

Flag this post

The Silent Threat: Visually Triggered AI Hijacking

dev.to·1d·

Discuss: DEV

👁️Vision Transformers

Flag this post

A Retrospect to Multi-prompt Learning across Vision and Language

arxiv.org·18h

👁️Vision Transformers

Flag this post

Loading more...