在昨晚的Google I/O发布会上,Google宣布了一系列AI模型的更新,涵盖了从文本到视觉和音乐的多个领域:
Gemini1.5Pro:支持200万上下文,针对翻译、编码、推理等关键用例进行了质量改进,但未发布测试结果。
Gemini Flash:针对响应速度至关重要的窄或高频任务进行了优化,价格比GPT-3.5更便宜。
Gemini模型家族:
Ultra:最大的模型,仅在Gemini Advanced提供。
Pro:最佳总体性能模型,API预览版中提供。
Flash:轻量级速度/效率模型,API预览版中提供。
Nano:设备上模型,将内置于Chrome126中。
Gemini Gems:谷歌的GPTs,支持自定义与Gemini的互动方式。
Gemini Live:基于声音的深入双向对话能力,Project Astra实时视频理解个人助理聊天机器人即基于此。
Gemma2:6月发布,规模为27B,以更小的尺寸提供接近Llama-3-70B的性能。
PaliGemma:谷歌的第一个视觉语言开放模型,灵感来自PaLI-3。
Veo:DeepMind开发的模型,旨在对标Sora,但一些体验者认为效果不尽人意。
Imagen3:图像模型,能够理解自然书写的提示,生成高质量逼真图像,并在渲染文本方面表现优异。
Music AI Sandbox:旨在改变音乐创作方式的AI工具,用户可以全新创作乐器部分,轻松转换不同曲目风格。
Trillium:谷歌最新的TPUs,计算性能比上一代TPU v5e提升高达4.7倍。
这次发布会展示了Google在AI领域的全面布局和创新能力,从文本到视觉再到音乐,Google的AI模型正在不断进步,为用户带来更加丰富和高效的体验。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
近日,京东3C数码联合《黑神话:悟空》发起“天命人向西游”活动,打开京东APP搜“天命人”进入活动页面,根据“天命人向西游”地图打卡山西景点即可一元抢万件联名好礼。
近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。