📷 OpenCV - upchuck5372 · Scour

Investigating Label Bias and Representational Sources of Age-Related Disparities in Medical Segmentation

arxiv.org·12h

Flag this post

Computer model mimics human audiovisual perception

techxplore.com·25m

Flag this post

Efficient Curvature-aware Graph Network

arxiv.org·12h

🔺Geometric Learning

Flag this post

FLoC: Facility Location-Based Efficient Visual Token Compression for Long Video Understanding

arxiv.org·12h

Flag this post

Building a Multimodal RAG That Responds with Text, Images, and Tables from Sources

towardsdatascience.com·21h

Flag this post

Integrating ConvNeXt and Vision Transformers for Enhancing Facial Age Estimation

arxiv.org·12h

👁️Vision Transformers

Flag this post

OMEGA: Optimized Multimodal Position Encoding Index Derivation with Global Adaptive Scaling for Vision-Language Models

arxiv.org·12h

Flag this post

3 Questions: How AI is helping us monitor and support vulnerable ecosystems

news.mit.edu·20h

🤖Machine learning

Flag this post

Connectivity Structure and Dynamics of Nonlinear Recurrent Neural Networks

journals.aps.org·17h

Flag this post

A high-resolution large-scale dataset for building segmentation from aerial imagery in northeastern Italy

nature.com·1d

🛰Remote sensing

Flag this post

Why Multimodal AI Broke the Data Pipeline — And How Daft Is Beating Ray and Spark to Fix It

hackernoon.com·1d

Flag this post

Multi-Representation Attention Framework for Underwater Bioacoustic Denoising and Recognition

arxiv.org·1d

👁️Vision Transformers

Flag this post

Saliency-Guided Domain Adaptation for Left-Hand Driving in Autonomous Steering

arxiv.org·12h

Flag this post

Few-Shot Multimodal Medical Imaging: A Theoretical Framework

arxiv.org·12h

👁️Vision Transformers

Flag this post

Learning and Leveraging Anisotropy Parameters in ANOVA Approximation

arxiv.org·12h

Flag this post

Fixed-point graph convolutional networks against adversarial attacks

arxiv.org·12h

Flag this post

FedReplay: A Feature Replay Assisted Federated Transfer Learning Framework for Efficient and Privacy-Preserving Smart Agriculture

arxiv.org·12h

👁️Vision Transformers

Flag this post

AD-SAM: Fine-Tuning the Segment Anything Vision Foundation Model for Autonomous Driving Perception

arxiv.org·1d

👁️Vision Transformers

Flag this post

OmniBrainBench: A Comprehensive Multimodal Benchmark for Brain Imaging Analysis Across Multi-stage Clinical Tasks

arxiv.org·12h

Flag this post

Our newest model: Chandra (OCR)

datalab.to·2d·

Discuss: Hacker News

Flag this post

Loading more...