👁 Vision Language Model - ali.mouizina · Scour

Two Bridges, One Pathway: From VLMs to Generalizable VLAs with Embodied Trajectory-Coupled Data

👁Computer vision Academic

AutoMine Solution for AV2 2026 Scenario Mining Challenge

📱Edge AI Academic

Less-relevant results

Why We Have No Idea How to Classify Language Models

🔥PyTorch Blog

MSUE: Multi-Modal Soccer Understanding Expert

👁Computer vision Academic

not much happened today | AINews

Vision Language Model Helps Private Information De-Identification in Vision Data

🎯Object Detection Academic

The Last Visible Pixel: Probing Fine-Scale Perception in Vision-Language Models

👁Computer vision Academic

CheXanatomy: Anatomy-Aware Vision-Language Modeling for Chest Radiographs

👁Computer vision Academic

Harnessing Streaming Video in the Wild

📱Edge AI Academic

MemoVAD: Resource-Efficient Video Anomaly Detection via Dynamic Semantic Memory in Edge Computing Scenarios

📱Edge AI Academic

DIRECT: When and Where Should You Allocate Test-Time Compute in Embodied Planners?

🤖AI Academic

Decoding Pedestrian Crossing Intention from Egocentric Vision via Vision Language Models

🎯Object Detection Academic

AgenticNav: Zero-Shot Vision-and-Language Navigation as a Tool-Calling Harness

📱Edge AI Academic

Do VLMs See What Sensors Feel? A Scalable Expert-Guided Design for Wheelchair Accessibility Assessment from Street View

👁Computer vision Academic

EasyLens: A Training-Free Plug-and-Play Subtle-Lesion Representation Amplifier for Medical Vision-Language Models

🔥PyTorch Academic

CLASP: Language-Driven Robot Skill Selection and Composition using Task-Parameterized Learning

🤖AI Academic

LEVANTE-bench: Multi-Scale Comparison of VLMs to Children Using Cognitive Tasks (or, "Is Your VLM Smarter Than a 5th Grader?")

🔥PyTorch Academic

Do VLMs Reason Like Engineers? A Benchmark and a Stage-wise Evaluation

📱Edge AI Academic

A Controlled Audit of Pretraining Contamination in Public Medical Vision-Language Benchmarks

👁Computer vision Academic

Nvidia DGX Spark GB10 – AI Models and Guide with vLLM and Autonomous Script

🔥PyTorch Code

github.com··Hacker News

Sign up or log in to see more results

Log in to enable infinite scrolling