• 首页 > 产经新闻频道 > 业界新闻

    开源化、多元化、商业化,谷歌杠上了大模型

    2024年08月08日 17:46:30   来源:Donews

      撰文 | 曹双涛

      编辑 | 杨博丞

      在日前谷歌举办的2024年I/O Connect China谷歌开发者大会上,AI大模型多元化成为市场关注的焦点。

      围绕APP软件开发,谷歌推出三种不同规格的Gemini模型。谷歌方面称,Gemini Nano是最高效的模型,适合处理设备端任务。

      据悉,Gemini 1.5 Flash是谷歌迄今为止最快、最经济的模型,适合处理高容量任务。面对所有开发者开放的Gemini 1.5 Pro,支持200万token 上下文窗口。为减少算力消耗,Gemini 1.5 Pro和1.5 Flash均已上线上下文缓存功能。

      考虑到开发者可能需要更大的灵活性和掌控力,谷歌推出Gemini姊妹大模型Gemma。新发布的Gemma2相较于Gemma,新增90亿和270亿参数两种规格。其中,270亿参数版本经过优化,同时支持Google Cloud上的单个英伟达GPU以及Vertex AI单个TPU运行。

      目前Gemini相关大模型已集成到Android Studio、Chrome DevTools、Project IDX、Colab、VS Code、IntelliJ和 Firebase等开发工具中,可帮助开发者编写、调试、测试代码、生成文档、理解代码库等。

      以Flutter为例,小米SU7配套应用就是基于Flutter所打造。在原有Flutter基础上,谷歌推出Flutter 3.24和 Dart 3.5。新版最大看点是“Flutter GPU”新API的早期预览版。如通过内置 Flutter SDK,开发者可使用Dart代码访问GPU,进而提高图像渲染能力。

      为方便开发者使用,谷歌推出多个Package。如Flutter_Scene可将3D项目直接导入,进而提高游戏体验。

      此外,谷歌也推出Android Studio ON IDX早期预览版,和原有Android Studi不同的是其支持在浏览器中完全运行。为保证借助AI构建应用的可靠性、合规性和安全性。谷歌推出包括如Firebase AI Monitoring 信息中心、Checks AI Safety等开发组件。

      在AI大模型开源席卷全球下,谷歌推出开源大模型项目Project Oscar。但初始阶段,Project Oscar仅支持93000条代码提交以及2000名开发者Go编程语言项目。

      围绕Web网站开发,随着Web GPU、WASM和Gemini内置到Chrome中,谷歌全新推出的Speculation Rules API可做到搜索即时导航,摆脱冗长页面加载。面向单页应用推出的View Transitions API,可提高页面过渡体验。二者结合,进而保证页面过渡的无缝衔接。

      为保证Web开发者开发效率,谷歌顺势推出试和优化应用Chrome DevTools,其在开发者网站出现问题时会发出警告和错误提示。该应用已内置到Gemini中。

      围绕下一代安卓原生应用开发,谷歌推出多款新产品。设备端AI模型Gemini Nano和系统服务AI Core;用于业务逻辑共享代码,适用于移动端、Web、服务器和桌面平台的Kotlin Multi Platform;并为DataStore、Room和ViewModel等多个Jetpack库添加Kotlin Multi platform支持。

      测试平台Android Device Streaming,则联合小米、OPPO、一加、三星等手机厂商,方便开发者进行终端测试,现处于Beta阶段。Gemini in Android Studio纳入Android Studio稳定版,新增代码生成和代码转换功能,以及AI隐私设置控制数据分享功能。

      围绕云业务,谷歌提出的云端新旅程具有五大特点:一是云上开发新范式,新推出的Vertex AI功能可实现上下文缓存和接地功能。二是自成体系的灵活扩展,新推出150多种模型,包括Gemini系列、Gemma开源模型、Anthropic Claude模型、Meta Llama模型和Hugging Face模型库。

      三是打破壁垒的跨云之旅,新推出的优化PostgreSQL数据库和BigQuery Omni功能,支持跨云互联和联合查询以及多“云”协同。四是轻松实现强大功能,新推出的自动化与智能默认设置,搭建全套云基础设施只需45分钟,包括网络、身份验证和日志记录等。

      五是AI智能助力,新推出的Gemini Code AssistIDE插件,提供代码生成、补全、解释和测试生成功能。Gemini in Databases则提供SQL生成和数据库操作智能化。

      围绕开发者发布多款大模型,无疑彰显谷歌想要加速推进大模型商业化的决心。但目前谷歌的AI能力,尤其是输出和检索能力可能仍需提高。

      今年6月份海外用户在询问谷歌“制作披萨使用多少胶水”问题时,谷歌AI搜索给出的答案为:据Business insider2024年5月的相关显示文章,谷歌Al搜索结果建议在披萨酱中加入1/8 杯,即2汤匙,白色无毒的胶水,以防止奶酪滑落。

      文章作者KatieNotopoulos 表示,胶水没有明显改变酱汁的稠度,而披萨呈现出诱人的橙色。海外媒体The Verge验证后发现,该截图并非伪造。因披萨中不能加入任何胶水,该答案也引发海外用户对谷歌AI检索能力的质疑。

      图源:The Verge

      图源:The Verge

      我们在对Gemini实测过程中发现,一方面Gemini文生图能力已被关闭,且Gemini暂时也不支持文生视频。另一方面,Gemini的逻辑推理、数学计算能力仍需提高。

      图源:Gemini官网

      我们将2024年高考数学真题给到Gemini且特意强调是多选题,三道题目正确答案分别为(BD)(ACD)(ABC),但Gemini给出的答案分别是(AC)(AD)(AB),虽说第10题和第11题Gemini的答案包括正确选项,但第9题却全部是错误选项。

      图源:2024年高考数学真题

      图源:Gemini官网

      此外,随着谷歌大模型日益增多,正面临数据中心电力消耗产生的二氧化碳排放迅速增加的棘手问题。

      谷歌相关环境报告指出,2023年仅谷歌数据中心电力消耗就增长17%,由电力消耗所产生的二氧化碳污染较2022年同期增长13%至1430万吨,大致相当于38家燃气发电厂每年可能排放的二氧化碳量。

      不仅仅是谷歌,Microsoft2023财年的温室气体排放量比 2020年高出约30%。对于未来如何降低碳排放,谷歌相关报告指出,随着我们进一步将人工智能集成到我们的产品中,由于人工智能计算强度的增加导致的能源需求增加,以及与我们的技术基础设施投资预期增加相关的排放,减少排放可能具有挑战性。

      按照当前AI大模型发展速度,未来对电力需求或将成倍增长。作为全球拥有最多数据中心的美国,引发当地民众对人工智能压倒电网的电力需求急剧上升的担忧,并可能使煤炭和天然气工厂的存在时间比其他方式更长。

      商业化、输出质量稳定化、减碳化等各种问题的存在,即使对于谷歌这样的全球大厂短期内也难言轻松。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。