好家伙,这两天 AI 大模型市场好戏不断,Gemini 和 ChatGPT 仰卧起坐式登榜。

在上周的文章当中,我们刚讨论了当时的【榜一大哥】—— Gemini-Exp-1114 的性能。文章发布后的第二天,OpenAI 便不甘示弱,发布新模型 ChatGPT-4o-latest (2024-11-20),一举夺回 LMSYS 竞技场排行榜榜首。


然而,OpenAI 才刚刚高兴了一天,奥特曼庆功的话音还未落,Gemini-Exp-1121 杀了出来!发布于11月21日的升级版实验模型 Gemini-Exp-1121,在上一代的基础上增强了代码能力、推理能力、多模态视觉能力,也使得谷歌 Gemini 力压 GPT-4o 和 Claude 3.5 Sonnet 重回榜首,夺得第一名的桂冠

截至目前,LMSYS 竞技场排行榜上最新的综合排名如下。



从官方发布的介绍来看,Gemini-Exp-1114 的亮点主要在于质量改进,而最新的 Gemini-Exp-1121 重点改进了编码、推理和视觉能力。



目前,Gemini-Exp-1114 和 Gemini-Exp-1121 在 Google AI Studio 上均为可用状态。

谷歌 Gemini 2.0 将于12月第二周发布!



大模型进入了以周为单位更新迭代的时代。Google 一通快拳出击,不仅水灵灵的接住了 OpenAI 的【挑衅】,好像还真打出了 Gemini 2.0



24日,谷歌云 AI 客户工程区域主管 Dambo Ren 透露:新版 Gemini 将在12月发布!据传,这个新版的 Gemini 指的就是备受期待的 Gemini 2.0,其将于12月的第二周面世,并将带来一系列令人瞩目的新特性。

据悉,作为AI技术的又一次飞跃,Gemini 2.0 将带来一系列令人瞩目的新特性。

CoT(Chain of Thought)推理能力将成为 Gemini 2.0  的一大亮点。这意味着模型在处理复杂任务时,将能够更好地模拟人类的思维链条,从而提高解决问题的效率和准确性。

此外,多模态能力的增强也让人期待不已。Gemini 2.0 将在视觉、听觉等多种感知模式上实现更自然的交互,进一步突破人机交互的界限。

上下文窗口的扩展同样引人注目。Gemini 2.0 将支持3到5百万的上下文窗口,这将极大地提升模型在处理长文本和复杂背景信息时的表现。

最令人兴奋的是,“Project Jarvis”的泄露。这一项目据称将打造一个类似于 Claude 3.6 的智能代理,深度整合于谷歌生态系统。此举无疑将为用户提供更为智能和无缝的体验。

谷歌在 AI 领域的雄心勃勃早已不是秘密。通过不断推出创新模型的同时,谷歌不仅巩固了其在行业内的领先地位,更将 AI 领域的竞争推向了白热化。这场年底的角力,无论是否真正发布 Gemini 2.0 版本,谷歌都无疑将为这场 AI 军备竞赛注入新的活力。让我们拭目以待吧!


返回全部