👁️ Vision Transformers - upchuck5372 · Scour

Beyond Humans: Multispecies Animal Face Recognition Using Transfer Learning

👁Computer vision Academic

Page image classifier fine-tuned on century-spanning archives of scanned documents for further content-specific processing

👁Computer vision Academic

Uncertainty-Aware Adaptive Sensor Fusion for Autonomous Navigation

👁Computer vision Academic

Less-relevant results

CL-CLIP: CLIP-Based Continual Learning Framework with Cost-Volume Category Decoupling for Object Detection

👁Computer vision Academic

An Open-Source Two-Stage Computer Vision Pipeline for Fine-Grained Vehicle Classification using Vision Transformers

👁Computer vision Academic

Vision-Assisted Foundation Model for Solving Multi-Task Vehicle Routing Problems

👁Computer vision Academic

LRMIL: Efficient Low-Resolution Multiple Instance Learning via High-Resolution Knowledge Distillation for Whole Slide Image Classification

🔍Grad-CAM Academic

SynIB: Informational Bottleneck for Maximizing Synergy in Multimodal Learning

🔍Grad-CAM Academic

AMN: An Adaptive Multi-Scale Fusion Network with Boundary and Uncertainty Modeling for Nuclei Segmentation

🔍Grad-CAM Academic

Don't waste SAM

👁Computer vision Academic

Textual Supervision Enhances Geospatial Representations in Vision-Language Models

🔍Grad-CAM Academic

HarmoView: Harmonizing Multi-View Constraints for Identity-Consistent Video Generation

📷OpenCV Academic

SlideCheck: Guiding Self-Supervised Pretraining of Pathology Foundation Models via Dataset Distributions

🔍Grad-CAM Academic

T-SAR-JEPA: Self-Supervised Temporal Anomaly Detection in SAR Amplitude Stacks via Latent Prediction

🔬scikit-learn Academic

How Much MRI Preprocessing Is Enough? A Cost-Utility Study for Brain MRI Foundation Models

🔍Grad-CAM Academic

Kwai Keye-VL-2.0 Technical Report

🧠OpenAI Academic

Human-Centered Benchmarking of Driver Monitoring Models

🔍Grad-CAM Academic

LatentWave: JEPA Pretraining for Wireless Foundation Models

🧠OpenAI Academic

Reconstructing Multi-Decadal Forest Disturbances: A Spatio-Temporal Transformer Approach

🤖Machine learning Academic

A Unifying View of Attention Sinks: Two Algorithms, Two Solutions

👁Computer vision Academic

Log in to enable infinite scrolling