Google DeepMind 发布 Gemini Omni：多模态理解与编辑的重大飞跃 (opens in new tab)

📌 One-Sentence Summary Demis Hassabis 宣布推出 Gemini Omni，这是一项多模态 AI 的重大进步，能够处理视频、音频和图像，并构建全新的场景。 📝 Summary Demis Hassabis 的这条推文公布了 Google DeepMind 的新多模态 AI 模型 Gemini Omni。该模型代表了世界理解与多模态编辑能力的重大飞跃，能够接收照片、视频和音频作为输入，并生成全新的场景。Hassabis 强调了它处理任意输入和输出的能力，首先从视频开始，并突出了该工具的交互特性，允许用户提供自己的视频并迭代创意。这标志着 Gemini Omni 向着更通用的 AI 界面迈出了基础性的一步。 📊 Article Meta AI Screening：92 Featured：Yes Source：Demis Hassabis(@demishassabis) Author：Demis Hassabis Category：人工智能 Language：英文 Read Time：2 min Word Count：294 Tags： Gemini ...

Read the original article