🧠 Reasoning Models - jobz · Scour

Version Controla and Agent Audit Platform

💾Agent Memory

cognatoai.com··Hacker News

Tight Sample Complexity of Transformers

✍️Prompt Engineering Academic

Ex150salmon review: Failure after only 14 days

🔁Spaced Repetition News

exfatloss.com··Hacker News

OpenMedReason: Scientific Reasoning Supervision for Medical Vision-Language Models

👁️Multimodal AI Academic

Dropout-GRPO: Variational Stochasticity for Continuous Latent Reasoning

🎯Reinforcement Learning Academic

Contextual Identity Laundering: How Claude’s Image Refusal Can Be Routed Through Web Search

✍️Prompt Engineering

lesswrong.com·

RecurGuard: Runtime Monitoring for Reasoning-Token Consumption Attacks

⚡Inference Academic

Bootstrapped Monitoring: Leveraging Transparent Reasoning to Oversee Stronger AI Agents

✍️Prompt Engineering Academic

When the Chain of Thought Knows Better: Failure Modes in Multi-Turn Reasoning Models

✍️Prompt Engineering Academic

Calibration Drift Under Reasoning: How Chain-of-Thought Budgets Induce Overconfidence in Large Language Models

✍️Prompt Engineering Academic

The Periodic Table of LLM Reasoning: A Structured Survey of Reasoning Paradigms, Methods, and Failure Modes

✍️Prompt Engineering Academic

Visual Para-Thinker++: A Single-Policy Multi-Agent Framework for Visual Reasoning

🤖AI Agents Academic

LLMs+Graphs: Toward Graph-Native, Synergistic AI Systems

🔗Graph Neural Networks Academic

UniReason-Med: A Shared Grounded Reasoning Interface for 2D-to-3D Transfer in Medical VQA

🎛️Fine-tuning Academic

Training Deliberative Monitors for Black-Box Scheming Detection

🎛️Fine-tuning

lesswrong.com·

MODF-SIR: A Multi-agent Omni-modal Distilled Framework for Social Intelligence Reasoning

🧠LLMs Academic

The Shibboleth Effect: Auditing the Cross-Lingual Distributional Skew of Large Language Models

🧠LLMs Academic

Building Better Activation Oracles

✍️Prompt Engineering

lesswrong.com·

IS-CoT: Breaking the Long-form Generation Collapse via Interleaved Structural Thinking

✍️Prompt Engineering Academic

Benchmarking Large Language Models for Safety Data Extraction

✍️Prompt Engineering Academic

Sign up or log in to see more results

Log in to enable infinite scrolling