🗂️ Semantic Segmentation - zhengjinyuan0525 · Scour

Training-Free Generalized Few-Shot Segmentation through Open-Vocabulary Semantic Arbitration

👁️Computer Vision Academic

SegmentAnyTreeV2: Scaling Transformer-Based Tree Instance Segmentation Across Sensors, Platforms, and Forests

👁️Computer Vision Academic

Mind the Gap: Disentangling Performance Bottlenecks in Video Instance Segmentation

👁️Computer Vision Academic

Zero-Parameter Geometric Gating for Temporally Stable Low-Altitude UAV Video Semantic Segmentation

👁️Computer Vision Academic

Segment and Select: Vision-Language Segmentation in 3D Scenarios

👁️Computer Vision Academic

iSAGE: A Human-in-the-Loop Framework for Remote Sensing Semantic Segmentation via Sparse Point Supervision

👁️Computer Vision Academic

PairWise Image Finder: An Open-source Tool for Finding Visually Aligned Street-Level Image Pairs for Urban Perception Studies

👁️Computer Vision Academic

MedSIGHT: Towards Grounded Visual Comprehension in Medical Large Vision-Language Models

🔀Multimodal AI Academic

S23DR 2026 Winning Solution

👁️Computer Vision Academic

ZODS-RS -- Zero-training Oriented Detection & Segmentation for Remote Sensing

👁️Computer Vision Academic

Geometric Coastline Localization using Vision-Language Models

🔀Multimodal AI Academic

CheXanatomy: Anatomy-Aware Vision-Language Modeling for Chest Radiographs

👁️Computer Vision Academic

Less-relevant results

Advanced Flood Prediction with Physics-Guided Deep Learning: Combining UNet, FNO, and SAR/Optical Imagery

👁️Computer Vision Academic

AMN: An Adaptive Multi-Scale Fusion Network with Boundary and Uncertainty Modeling for Nuclei Segmentation

👁️Computer Vision Academic

Temporal Context Conditioning for Seasonality-Aware Precipitation Nowcasting of High-Intensity Rainfall

🫧Gaussian Splatting Academic

TrioPose: Native Triple-Stream Diffusion Transformers for Pose-Guided Text-to-Image Generation

👁️Computer Vision Academic

WHU-Infra3D: A Full-stack Multi-modal Dataset and Benchmark for 3D Roadside Infrastructure Inventory

📡Point Clouds Academic

PhysGraph: A Physics-aware 3D Scene Graph for Perception and Reasoning

👁️Computer Vision Academic

Globally Localizing Lunar Rover in Pixels via Graph Alignment

👁️Computer Vision Academic

Video-Rate Streaming Stylization on a Vision-Aware MLLM-Conditioned Edit Diffusion: Asymmetric Batched Inference on a Distilled UNet + MLLM Text Encoder

👁️Computer Vision Academic

Log in to enable infinite scrolling