Gemini 与 GPT-4o “掰手腕”，把 Gemini 2.0 掰来了

好家伙，这两天 AI 大模型市场好戏不断，Gemini 和 ChatGPT 仰卧起坐式登榜。

在上周的文章当中，我们刚讨论了当时的【榜一大哥】—— Gemini-Exp-1114 的性能。文章发布后的第二天，OpenAI 便不甘示弱，发布新模型 ChatGPT-4o-latest (2024-11-20)，一举夺回 LMSYS 竞技场排行榜榜首。

然而，OpenAI 才刚刚高兴了一天，奥特曼庆功的话音还未落，Gemini-Exp-1121 杀了出来！发布于11月21日的升级版实验模型 Gemini-Exp-1121，在上一代的基础上增强了代码能力、推理能力、多模态视觉能力，也使得谷歌 Gemini 力压 GPT-4o 和 Claude 3.5 Sonnet 重回榜首，夺得第一名的桂冠。

截至目前，LMSYS 竞技场排行榜上最新的综合排名如下。

从官方发布的介绍来看，Gemini-Exp-1114 的亮点主要在于质量改进，而最新的 Gemini-Exp-1121 重点改进了编码、推理和视觉能力。

目前，Gemini-Exp-1114 和 Gemini-Exp-1121 在 Google AI Studio 上均为可用状态。

谷歌 Gemini 2.0 将于12月第二周发布！

大模型进入了以周为单位更新迭代的时代。Google 一通快拳出击，不仅水灵灵的接住了 OpenAI 的【挑衅】，好像还真打出了 Gemini 2.0。

24日，谷歌云 AI 客户工程区域主管 Dambo Ren 透露：新版 Gemini 将在12月发布！据传，这个新版的 Gemini 指的就是备受期待的 Gemini 2.0，其将于12月的第二周面世，并将带来一系列令人瞩目的新特性。

据悉，作为AI技术的又一次飞跃，Gemini 2.0 将带来一系列令人瞩目的新特性。

CoT（Chain of Thought）推理能力将成为 Gemini 2.0 的一大亮点。这意味着模型在处理复杂任务时，将能够更好地模拟人类的思维链条，从而提高解决问题的效率和准确性。

此外，多模态能力的增强也让人期待不已。Gemini 2.0 将在视觉、听觉等多种感知模式上实现更自然的交互，进一步突破人机交互的界限。

上下文窗口的扩展同样引人注目。Gemini 2.0 将支持3到5百万的上下文窗口，这将极大地提升模型在处理长文本和复杂背景信息时的表现。

最令人兴奋的是，“Project Jarvis”的泄露。这一项目据称将打造一个类似于 Claude 3.6 的智能代理，深度整合于谷歌生态系统。此举无疑将为用户提供更为智能和无缝的体验。

谷歌在 AI 领域的雄心勃勃早已不是秘密。通过不断推出创新模型的同时，谷歌不仅巩固了其在行业内的领先地位，更将 AI 领域的竞争推向了白热化。这场年底的角力，无论是否真正发布 Gemini 2.0 版本，谷歌都无疑将为这场 AI 军备竞赛注入新的活力。让我们拭目以待吧！

返回全部