首个Agentic多模态检索大模型来了！清华团队让AI边推理边主动看图，准确率提升23% (opens in new tab)

近年来，随着多模态大语言模型（MLLM）的快速发展，研究者们开始尝试将其应用于通用多模态检索任务。与此同时，思维链（Chain-of-Thought，CoT）推理被引入检索领域，通过增强模型的推理能力来改善候选结果的排序。然而，一个重要问题始终未能得到解决：现有的推理过程本质...