Meta公司宣布了一项重大技术进展,发布了其最新的开源模型——Llama3。这一模型包含两种参数规模:8B(80亿参数)和70B(700亿参数),预计将于今年7月正式面世。Llama3模型不仅具备多模态能力,还集成了新的计算机编码功能,能够输出文本和图像,预示着其未来将被应用于雷朋 Meta 智能眼镜等设备。
Meta公司与谷歌建立了合作伙伴关系,将实时搜索结果整合到 AI 助手的答复中,进一步提升了用户体验。与前代 Llama2相比,Llama3在多个行业基准测试中展现了突破性的性能,特别是在推理、代码生成和指令跟踪等方面取得了显著进步。为了训练这一模型,Meta 构建了两个包含2.4万个GPU的集群,其中1.6万个GPU同时用于Llama3的训练。
Llama3的开发预示着 Meta 在 AI 领域的雄心壮志。目前,公司正在开发的最大型模型拥有超过400B(400亿)的参数规模。Meta Llama3的主要性能特点包括:
模型规模与类型:提供8B和70B两种规模的预训练和指令调优生成文本模型,专为对话和其他语言处理任务优化。
模型架构:采用自回归方法和基于优化的变换器架构,引入了分组查询注意力机制,提升了大规模参数下的推理可扩展性。
训练与数据处理:使用超过15万亿的tokens进行预训练,训练集是Llama2的七倍,支持高达30种语言。
性能与基准测试:在多个自动化基准测试中表现出色,包括对话、问答、推理等多种任务,并特别针对现实世界场景进行了优化。
Meta 还发布了基于 Llama3的 AI 助手,目前已在美国之外的十多个国家推出。用户可以在 Facebook、Instagram、WhatsApp 和 Messenger 上使用 Meta AI 助手,它能够推荐餐厅、规划周末活动、协助学习等。此外,Meta AI 还整合了搜索功能,可以直接访问网络上的实时信息,无需切换应用。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
华为 Pura70 系列突然先锋开售,你抢到了吗?对于这次的新机来说,除了一如既往的优雅设计和强悍的硬件配置外,我们更为关注的则是其全球首发的「楼层级设备查找」功能,软实力也可以很硬核!
近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。