开云手机版入口DeepSeek逼出谷歌新推理模型：40分优势超GPT45登顶竞技场但依然败给“竹竿问题”-开云手机版·(中国)官方登录下载

分类

开云手机版入口DeepSeek逼出谷歌新推理模型：40分优势超GPT45登顶竞技场但依然败给“竹竿问题”2025-03-28 01:07:32

　　首个版本Pro Experimental一登场就抢下大模型竞技场第一名，并且整整比GPT-4.5高出40分！

　　帮我制作一款吸引人的无尽跑酷游戏。屏幕上要有关键操作说明。使用p5js，不要用HTML。我喜欢像素风格的恐龙和有趣的背景。

　　谷歌介绍，相较于Gemini 2.0 Flash Thinking这个谷歌首个推理模型，Gemini 2.5在基础模型和后训练技术上都有改进。

开云手机版入口DeepSeek逼出谷歌新推理模型：40分优势超GPT45登顶竞技场但依然败给“竹竿问题”

　　不仅是在大模型竞技场上一举拿下高分，开云手机版平台在各种推理、数学、科学、编程基准上，Gemini 2.5 Pro都表现出色，属于是编程能跟Claude 3.7 Sonnet掰手腕，数学能跟Grok 3相媲美。

　　Gemini 2.5 Pro的上下文窗口是1M tokens，并且支持原生多模态：可以理解庞大数据集并处理来自不同信息源的复杂问题，包括文本、音频、图像、视频，甚至是整个代码库。

　　在推理能力之外，谷歌官方还强调了一把Gemini 2.5 Pro的编程性能：

　　谷歌DeepMind研究员们也释出了更多案例，比如把“六边形内旋转小球”这事整得更加酷炫：

　　p.s. 距离谷歌上新Gemini 2.0家族，也不过一个多月时间，怕不是让DeepSeek给逼急了（doge）。

　　不过，当我们拿最新大模型难题“竹竿问题”测试Gemini 2.5 Pro时，它并没能顺利通关。

　　原标题：《DeepSeek逼出谷歌新推理模型：40分优势超GPT4.5登顶竞技场，支持原生多模态，但依然败给了“竹竿问题”》

　　本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，开云手机版平台澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

分享到：

快速导航×