• 首页 > 云计算频道 > 大模型

    谷歌开源Gemma:参数小、性能超越Llama2,可轻松在笔记本上运行

    2024年02月22日 11:25:08   来源:站长之家

      2月22日 消息:谷歌于2月22日宣布开源大语言模型Gemma,成为其生成式AI领域的新力量。Gemma采用Gemini架构,有20亿、70亿两个版本,分别支持预训练和指令微调。

      据谷歌公布的测试结果显示,Gemma70亿模型在数学、推理、代码方面的能力超过了Llama-2的70亿和130亿,成为小参数类ChatGPT模型中最强的之一。

      最令人振奋的是,Gemma不仅性能强大,而且可商用,并且轻松在普通笔记本、台式机上运行,无需庞大的AI算力。这使得开发者可以更加便捷地应用Gemma模型,而Kaggle和Hugging Face等平台也提供了方便的获取途径。同时,为了帮助使用Gemma的开发者更安全地构建AI应用程序,谷歌推出了Responsible Generative AI Toolkit等一系列工具。

      Gemma的优势不仅在于性能和可用性,还体现在其全面的优化。谷歌强调,开发者可以在多框架工具中进行推理和微调,跨设备兼容性也是Gemma的一大特色,支持笔记本电脑、台式机、物联网、移动设备和云等多种设备类型。与NVIDIA的合作使得Gemma在GPU优化上表现出色,涵盖了从数据中心到云端再到本地RTX AI PC的多个硬件平台。

      对于使用Google Cloud的开发者,Gemma同样得到了优化。Vertex AI提供全面的MLOps工具集,支持一键式部署,并具有内置推理优化功能。高级定制功能通过完全管理的顶点人工智能工具或自我管理的GKE实现,包括部署到GPU、TPU和CPU平台上具有成本效益的基础设施。

      谷歌通过Gemma的性能测试展示了其在主流平台中的优越表现,尤其在数学、推理、代码等方面的标准学术基准测试平均分数都高于同规模的Llama2和Mistral模型。这表明,Gemma作为一款参数相对较小但性能异常强大的大模型,将为开发者提供更灵活、高效的AI应用解决方案。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时探行数字人注册免费试用

    中兴二合一 5G 云电脑“逍遥”系列上架:一键切换双模式,

    5 月 10 日消息,据中兴通讯官微,中兴二合一 5G 云电脑“逍遥”系列已经在电商平台上架。其支持本地、云端双模式,可在电脑与平板模式之间一键切换。售价方面,型号为 W200DS 的产品首销价格为 1899 元。

    新闻探行AI智能外呼系统 节省80%人力成本

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT探行AI客服 24小时无休机器人接待

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费探行AI视频 快速生成真人营销视频

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究探行AI整体解决方案 全国招募代理

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。