谷歌劈柴立军令状：必斩OpenAI，夺回第一！

2024年12月30日 09:05:30 来源：新智元公众号

　　谷歌CEO劈柴在年度战略会议上放出狠话，2025年将是AI领域生死存亡之年。一场足以改变AI未来走向的巅峰对决，即将在2025年全面打响。

　　2025年还未开始，硅谷的战鼓已经擂响。

　　在这场AI巨头之间的角力中，谷歌CEO劈柴放出了一记重磅炸弹。

　　在谷歌山景城总部举行的年度战略会议上，身着节日毛衣的劈柴语气凝重地对员工们说道——

　　2025年将是关键的一年!

　　我们必须认识到当下时刻的紧迫性，公司需要以更快的速度前进。这是一个颠覆性时刻，赌注从未如此之高。

　　这番话背后，是谷歌与微软OpenAI之间愈演愈烈的较量。

　　自ChatGPT横空出世以来，这家搜索引擎巨头一直在努力追赶。过去两年，谷歌的努力几乎总被爱抢风头的OpenAI盖了过去。

　　直到12月，Gemini2.0Flash、Veo2、「谷歌版o1」Gemini2.0Flash Thinking等轮番轰炸，一展超越领先模型的潜力。仅用了90天的时间，谷歌终于逆风翻盘。

　　这意味着，这场AI竞赛终于迎来了转折点。

　　会议现场，劈柴展示了一张大模型的对比图，Gemini1.5傲然领先于OpenAI等其他竞争对手的模型。

　　当被问及ChatGPT正成为AI的代名词时，劈柴坦言道，「在历史场长河中，你不必总是第一个，但必须出类拔萃，必须在同类产品中保持第一梯队。这就是2025年的意义所在」。

　　谷歌开发者关系负责人Logan Kilpatrick多次暗示，明年谷歌真的要发力了。

　　——预计1月份的目标，完整版Gemini2.0正式上线。

　　甚至，在谷歌DeepMind CEO Hassabis年度总结下面，他称这些都只是开胃菜，好戏将在2025年开始。

　　有网友预测道，明年谷歌将会把很多强大模型免费推向所有人，而且还会发布直击o3的竞争模型。

　　为了在这场AI革命中占据制高点，谷歌正全力以赴。

　　Gemini，下一个5亿级用户爆款应用

　　对谷歌而言，可能更糟糕的是竞争对手OpenAI在搜索业务的挑战。

　　虽然谷歌仍主导搜索市场，但GenAI为人们提供了各种访问在线信息的新方式。

　　而OpenAI正在被更多人看作是AI的代名词，如同国外把谷歌看作搜索的代名词一样。

　　谷歌背负着巨大的压力，正通过重金投资Gemini，来巩固期在AI领域的领先优势。

　　Gemini应用程序允许用户访问许多工具，包括谷歌的聊天机器人。

　　劈柴表示，「建立大型新业务」是重中之重。

　　谷歌目前拥有15个用户超过五亿的应用，而高管们普遍认为Gemini应用将是下一个。

　　劈柴认为Gemini应用具有「强劲势头」，但也不得不承认「在2025年还有一些工作要做，以缩小差距并建立领导地位」。

　　劈柴后来补充道:「明年最大的重点是在消费者方面扩展Gemini。」

　　此外，谷歌在美国还被法律缠身，包括其在垄断搜索的法律裁定，以及非法主导在线广告技术的指控。

　　英国监管机构则暂时认定谷歌的广告技术行为影响了该国的竞争力。

　　对此，劈柴表示:「这是我们的规模和成功所带来的。这是科技正在大规模影响社会的大趋势的一部分。因此，此时此刻，我们要比以往任何时刻都要确保自己不会分心。」

　　谷歌，「后来者」居上?

　　OpenRouterAI的数据显示，谷歌旗下的Gemini在开发者中的市场份额从9月份的约5%，直接飙升至>50%市场份额，遥遥领先，连带股价也上涨了14%。

　　而此时，距离OpenAI发布ChatGPT的2022年11月30日，已经整整过去了2年。

　　早在2017年，Sam Altman在一次邮件交流中就明确表示，谷歌DeepMind是在AGI竞争中最强大的对手，但令他没想到的是，曾经公认的「AI巨头」谷歌却是个「花架子」。

　　ChatGPT发布以来，几乎成了「AI的代名词」，不仅迅速征服了市场，还连带着微软起飞，在Edge浏览器中嵌入C o p i l o t AI搜索助手，直接断崖式领先。

　　被寄予厚望的谷歌，反倒是昏招频出，先是Bard难产，又经历AI Overview总结能力大翻车，建议孕妇吸烟、自杀跳桥等等。

　　在AI顺风车下，股价不涨反降，谷歌一时间沦为笑柄，被OpenAI打的毫无还手之力，更准确的说，连同台竞技的资格都没有。

　　让人费解的是，谷歌和DeepMind拥有世界上最好的硬件、最多的训练数据、最顶尖的人才，也发过很多具有划时代意义的论文，如AlphaFold、GenCast等，但为什么就连Anthropic这样的创业公司都打不过?

　　网友分析的细节原因不胜枚举，一句话来说，就是「船大难掉头」。

　　从安全性上考虑，谷歌作为世界级独一档的科技巨头，不论发布什么产品，其用户群体都不会小，会涉及到各个种族、不同的意识形态，一点小问题就会被无限放大，而文本生成又是非常主观的，很容易受到训练材料的偏见影响，所以谷歌需要更长的时间进行合规检查。

　　23年初，谷歌受舆论裹挟，急急忙忙发布Bard，在发布会上关于问题「关于詹姆斯·韦伯太空望远镜，我可以告诉我9岁的孩子它有哪些新发现?」，Bard给出错误答案。

　　这直接导致公司股价暴跌8%，市值缩水1000多亿美元，让投资群体和用户大失所望。

　　但其实OpenAI的产品也经常胡说八道、张冠李戴，不过因为是创业公司，所以大众的容忍度会高很多，产品标注为beta测试，还可以不断迭代修改。

　　作为大公司的谷歌，也受到更多法律上的限制，比如用户数据的版权问题。

　　谷歌曾因在AI训练过程中违反欧盟版权法被罚款2.5亿欧元，也是全球首个因AI训练数据被罚款的案例，坐拥金山，却无法使用，无异于自断双臂。

　　谷歌的产品线庞大，想要在所有产品中都加入AI驱动，需要非常细致的产品管理能力，而去年末发布的Gemini1.0，因其过度「多样化」的策略，再次导致股价下跌。

　　不过，「成功者说什么都是对的」，谷歌重新以王者之姿横扫AI，未来还计划继续引领「智能体」发展，携手浏览器和手机端，全自动实现用户任务。

　　谷歌年度AI大事件

　　谷歌并非没有看到AI市场的巨大潜力，但2024年才算是开始「发力」的一年。

　　很多有名气的产品基本都是在今年发布的，比如各种版本的Gemini，NotebookLM，Pixel手机上的AI功能等等。

　　谷歌宣称在2024年有「60条重大AI发布」，不妨看看其中几条主要的基础能力。

　　Gemini模型

　　去年12月，谷歌推出首个原生多模态模型Gemini1.0，打响了谷歌的AI反击战。

　　它可以同时处理文本、视频、图像、音频和代码等数据，结合了包括数学、物理、历史、法律、医学和伦理在内的57个学科，也是第一个在MMLU(大规模多任务语言理解)基准上超越人类专家的模型。

　　今年2月，谷歌将Gemini 升级到1.5，把上下文窗口从32k提升到100万个token，超越了同时期所有大模型。

　　在推理性能上也有大幅提升，Bard也正式更名为Gemini

　　7月，免费版Gemini1.5Flash发布，支持40多种语言，覆盖230多个国家和地区，质量和延迟都有大幅提升，尤其是在推理和图像理解方面。

　　12月推出的Gemini2.0Flash集成了多模态和原生工具使用能力，标志着大模型正式迈入「智能体」时代。

　　基于Gemini2.0，谷歌构建了原型项目Mariner，从浏览器出发探索全新的人机交互方式:训练Gemini来理解并推理浏览器屏幕上的信息，包括像素和文本、代码、图像和表单等元素，然后通过实验性的Chrome扩展程序自主完成复杂任务。

　　在产品方面，谷歌于今年5月基于Gemini推出Ask Photos功能，用户可以通过输入关键词，如地点、人物和日期，或是类似「主题生日派对」等自然语言概念对照片库进行检索。

　　去年7月，谷歌推出了一款AI驱动的科研和写作助手NotebookLM。

　　一年后，其底层模型切换为Gemini1.5Pro，用户可以上传研究笔记、访谈记录或公司文件，然后提出相关问题以理解和探索复杂材料，支持幻灯片、pdf等多种格式。

　　9月，NotebookLM发布重磅Audio Overview功能，模型可以针对用户材料生成两位AI主持人互相讨论的音频，可以帮助用户对材料进行「总结」和「深入讨论」。

　　不过该功能目前仍然处于实验阶段，比如只会英语，无法打断等问题。

　　AlphaFold3

　　今年5月，谷歌的AlphaFold3论文在Nature上发表，在预测蛋白质与其他分子类型相互作用上性能提升了至少50%，在某些重要的相互作用类别，其准确率甚至能翻倍。

　　2020年发布的AlphaFold2实现了蛋白质结构预测的根本性突破，在包括疟疾疫苗、癌症治疗和酶设计等领域辅助数百万科研人员进行新发现，引用超过2万次。

　　AlphaFold3则跳出蛋白质，进入广泛的生物分子领域，有可能解锁更多变革性科学成果，比如开发生物可再生材料和更具弹性的作物，加速药物设计和基因组学研究。

　　11月，研究人员发布了AlphaFold3模型代码和权重，以供学术使用。

　　Pixel移动端

　　1月份，谷歌宣布为新款Galaxy S24系列的录音、笔记等软件基于Gemini Pro提供摘要能力;基于文生图模型Imagen2，为Galaxy S24图库提供生成式照片编辑功能。

　　八月，谷歌发布自家手机Pixel9，使用全新的定制芯片Tensor G4提供AI计算能力，整合了大量AI能力，包括生成定制天气报告、整理截图信息、本地文生图等多种功能。

　　其中最重要的Gemini Live，能够以更直观、自然的方式帮助用户计划旅行攻略、解决家庭维修问题、构思礼物等等。

　　期待明年谷歌即将带来的礼物。

　　文章内容仅供阅读，不构成投资建议，请谨慎对待。投资者据此操作，风险自担。

[No. ]
分享到微信

即时

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算

第十四代英特尔® 酷睿™ 处理器(代号Raptor Lake S Refresh)采用了先进的Intel 7制程工艺。

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算

“强悍小透明”真我Neo7 Turbo正式发布，国补到手1699.15

谷歌劈柴立军令状：必斩OpenAI，夺回第一！

即时

第十四代英特尔@酷睿™ 处理器：性能飞跃，重塑计算

新闻

明火炊具市场：三季度健康属性贯穿全类目

企业IT

重庆创新公积金应用，“区块链+政务服务”显成效

3C消费

华硕ProArt创艺27 Pro PA279CRV显示器，高能实力，创

研究

中国信通院罗松：深度解读《工业互联网标识解析体系

专题

谷歌劈柴立军令状：必斩OpenAI，夺回第一！

扩展阅读