谷歌发动对OpenAI的最强反击

水中刀 • 2024年02月09日 15:03 • 新闻资讯

就在2月8日，谷歌Gemini又迎来一次重大更新。

首先，2023年年底承诺的Gemini最强版本Ultra，和GeminiAdvanced服务正式对外发布；另外，谷歌的生成式AI品牌迎来收束：Bard消失了，只保留Gemini，此前传闻的BardAdvanced，最终证实是GeminiAdvanced。

最后，谷歌生态发力。GeminiUltra全方位进入谷歌生态产品，包括安卓端的GoogleAssistant、iOS端的GoogleApp、谷歌云、谷歌文档、Gmail等等。

这是迄今为止，谷歌给予OpenAI的最强反击。

GeminiUltra，无缝接入生态

目前无论是GoogleCEO皮查伊还是GoogleAssistant和Bard副总裁兼总经理萧茜茜，都没在2月8日的官网发布中透露更多技术细节，目前能得知的仅限于皮查伊的部分带有主观色彩的描述：

1. 最大的模型Ultra1.0是第一个在MMLU（大规模多任务语言理解）上优于人类专家的模型，MMLU使用57个科目的组合——包括数学，物理，历史，法律，医学和伦理——来测试知识和解决问题的能力。

2. 它可以是个人导师，根据您的学习风格量身定制。或者它可以是一个创意合作伙伴，帮助你规划内容策略或制定商业计划。

从去年12月的发布来看，GeminiUltra的特长是多学科复杂知识的理解和处理上、在MMLU（大规模多任务语言理解）测试框架中，GeminiUltra的得分是90.0%，在新的MMMU（专家AGI的大规模多学科多模式理解和推理）基准测试中取得了59.4%的分数。有消息称，GeminiUltra1.0动用了五倍于GPT-4的算力进行训练。

谷歌发动对OpenAI的最强反击

GPT-4与GeminiUltra的性能对比，来自Google技术博客

但在2023年12月6日发布时，谷歌表示还在对Ultra版本进行微调、强化学习和有对抗的安全检查，至于这一部分工作进展如何，发布中并未提及。不过Alphabet的首席科学家JeffDean表示Gemini1.0技术报告已经更新，重点在第六节和第七节，主要提及Gemini1.0的Post-trainning（训练后微调）以及模型评估、产品评估等内容。（Gemini1.0技术报告下载链接：gemini_1_report.pdf(storage.googleapis.com)）

关于付费计划，谷歌称之为GeminiAdvanced，集成在GoogleOneAIPremiumPlan权益里，标价每月19.99美元，比ChatGPTPlus便宜一美分，赠送两个月免费试用期和2T存储空间。购买之后，就可以在Gmail、GoogleDoc里使用Gemini——当然，现在还不行，ComingSoon。

此外，谷歌也公布了由GemeniUltra支持的Advanced付费服务，在谷歌生态内的渗透情况，最吸引人的大概是其和GoogleAssistant适配。如果你用的是谷歌的Pixel系列手机，那么通过语音“heygoogle”即可呼出GemeniUltra，既可以为刚刚拍摄的照片起个标题，也可以围绕你正在阅读的文章，提供解读服务。未来还可以对智能家居进行控制。

谷歌发动对OpenAI的最强反击

iOS系统上，在谷歌应用里，也可以实现到Gemini的一键切换，只是在整体体验上，遵循APP逻辑，不如Pixel、安卓原生支持Gemini的体验丝滑。

在办公工具的协同上，Gemini1.0的优势在于提供基于搜索引擎结果的可靠内容，且会有意在回答中添加一些结构化数据，比如表格，表格同样可以便捷导入Googlesheets。

巨头反击的最好方式：攥紧拳头

如果说昨天的发布，绝大部分都回应了2023年12月的预告，在大家的意料之中，那么Bard品牌的消逝，对Gemini品牌的全线扶正，则给了人们惊喜，也体现了谷歌的决断力。

巨型企业，为了长期保持竞争力，通常会采用“赛马机制”，在内部多线、并行的对某一领域、某一赛道开展进攻，通过内部竞争来保持活力。但这也让人员变得臃肿、注意力变的分散，当真正的挑战者到来时，巨头往往不能及时调集全部资源，做出反应。投资界将其称之为“创业者的机会窗口”。

2014年，在收购完成后，Google几乎拥有世界最强的两个AI团队：GoogleBrain、GoogleDeepmind，他们创造了AlphaGo，发明了Transformer，却在生成式AI时代的早期被击溃。

Google的力量太分散了，且缺乏危机感。

在很长一段时间里，人们很难说清楚Google到底有多少个AI技术框架和产品：Transformer

、AlphaGo、Bard、Bert、Duplex、Pathways、Imagen、PaLM1.0/2.0，包括Meena，后来更名为LaMDA。

Google实际上很早就注意到了GPT-3的表现，但受限于复杂的组织架构和分散的资源，并未引起足够重视。2020年，Google基于自己的Transformer论文孵化出了ChatBot：Meena，但据说一直被内部力量阻挠发布、商业化，直到一年后改名LaMDA面世。

负责Meena项目的两名研究员DanielDeFreitas和NoamShazeer，因此拒绝了谷歌的多次挽留，愤而离职，创立了今天爆红的character.ai。

痛定思痛的谷歌，第一刀就砍向了组织：2023年4月，GoogleDeepMind和GoogleBrain合并，一致对外。

第二刀发生在昨天：全线收束品牌，全部归拢在Gemini之下。Gemini其实不是Google在生成式AI领域的推倒重建，它是过去谷歌技术积累的总和——从前人们会讨论，使用了Pathways方法的PaLM2.0表现如何，Imagen在多模态领域表现如何，但今天，只看Gemini就可以了，它是一个在Transformer基础上创建，融合了Pathways方法和PaLM成果的全新模型。AlphaGo的深度学习能力、Imagen的多模态能力，都在其中得以彰显。

此外，OpenAI 的成功，持续给谷歌带来强大的压力，也迫使谷歌放弃过于保守的心态。

2月9日有消息称，OpenAI的年化收入已超过20亿美元，据两名了解该公司财务状况的人士称，该公司年运转率(将前一个月的收入乘以12)在2023年12月达到了20亿美元的里程碑。消息人士补充说，OpenAI相信，由于企业客户对使用OpenAI的技术推进生成式人工智能工具在工作场所的运用有浓厚兴趣，该公司可以在2025年将这一数字增加一倍以上。

在 OpenAI 的刺激下，从PaLM2.0到Gemini1.0，谷歌用仅仅几个月的时间，实现在各种测试机准上的成绩大幅提升。谷歌的动作也更加敏捷了，2023 全年与生成式 AI 相关的公司级重大发布、调整动作多达 4 起，为历年之最。

谷歌发动对OpenAI的最强反击