• 首页 > 云计算频道 > 大模型

    Meta推出Llama 2,大模型赛道要因开源乱起来了

    2023年07月22日 19:10:07   来源:三易生活公众号

      本文来自于微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌。

      最近这段时间,Meta可谓是成为了海外互联网行业的焦点,其创始人扎克伯格一边与马斯克约架,一边仅用5天收获上亿用户的Threads成功奇袭了推特。近日,此前本来在AI大模型战局中扮演小透明角色的Meta,突然又搞出了一件大事。

      就在北京时间7月19日,Meta方面在微软的Inspire合作伙伴大会上宣布,将与包括微软在内的主要云计算服务提供商合作,推出新一代开源大模型Llama2,并将该模型免费开放给商业和研究机构使用。

      根据Meta方面的说法,在这一项目中,他们承担了大模型训练的成本,而包括微软、亚马逊在内的云计算服务提供商将托管这款大模型,并提供运行其所需的算力。对此,Meta生成式AI事业群副总裁Ahmad Al Dahle表示,Meta方面之所以迅速推出Llama2,是因为前代产品Llama的受欢迎程度出乎预料,他们收到了超过10万个关于Llama的申请。

      彼时Meta给Llama的身份是开源研究工具,只提供非商业化机构使用,如果不是这款大模型意外在4chan上泄露,很有可能就默默无闻了。如今回过头来看,Llama的泄露很有可能是Meta有意而为之,并借此来试探社区对于开源大模型的态度,而在得到了社区身体力行的支持后,Llama2也就很快诞生了。

      值得一提的是,Llama2并不是Meta的赶工之作,如果他们没有弄虚作假的话,其本身的性能就相当出世。根据Meta方面公布的数据显示,Llama2相较于上一代训练数据提升了40%,上下文长度也翻倍,并采用了分组查询注意力机制。在官方给出的测试结果中表明,Llama2在mmlu、agieval等多个权威大模型评测基准中,关于推理、编码、知识测试等方面的表现都优于其他开源模型,甚至在某些场景下有着接近GPT-3.5的水准。

      不过性能或许并非外界对于Llama2的到来感到欢欣鼓舞的关键,Meta决定其可免费用于商业用途,无疑才是大家喜出望外的原因。为了实现可控的商业化,Meta方面已经组织自己的员工和第三方围绕Llama2进行了Red Team测试,避免该模型产出有害内容,并为开发者制定了使用指南和守则。

      事实上,Meta的Llama系列大受业界欢迎的原因很简单,因为这是一个少有的开源AI大模型。但受到开源协议的限制,基于该模型衍生的产品都无法商业化,直到Llama2的出现给了整个业界一个“站在巨人肩膀上”的机会。

      至于说为何Meta会选择开源Llama2,而不是像OpenAI的ChatGPT、谷歌的Bard一般敝帚自珍,扎克伯格是这样说的,“Meta有着悠久的开源历史,开源推动创新,它让更多开发者能够使用新技术进行开发,同时提高了技术的安全性。我们相信如果生态系统更开放将带来更多进步,这就是我们开源Llama2的原因。”

    图片

      要知道截至目前为止,无论海外市场的OpenAI、微软、谷歌,还是国内的百度、阿里、360,在AI大模型领域都采用的是“闭门造车”的策略。这也是为什么大模型到底是不是创业的机会,会在创业者和投资人之间产生分歧的关键。

      事实上,大语言模型是“力大砖飞”的结果,在OpenAI的ChatGPT一鸣惊人之前,业界更青睐的是谷歌的Transformer模型,追求的是如何设计出更小、更快,但更准确的神经网络。而ChatGPT的成功,就成功在它提出了一个新的思路,那就是加大参数、加高算力的大模型也是一条路,并且真的让其产生了智能。

      但问题在于,如果单纯从技术层面出发,大模型的技术壁垒并非深不可测,否则即便OpenAI对自己基于人类反馈的强化学习(RLHF)技术秘而不宣,也没能阻挡不了百度的文心一言、阿里的通义千问、谷歌的Bard等一众大模型的出现。甚至在很短的时间里,国内市场的“百模大战”就正式开打,这也代表着这个领域的先发优势可能几乎不值一提。

      只可惜,大模型的技术壁垒不高或许仅仅是针对大型互联网厂商适配,但对于创业者而言,需要高算力、大数据和强算法,并且消耗海量资源的搭建通用大模型几乎只能是巨头们的游戏,大多数创业者有心无力。如果没有Meta开源的Llama,创业者就只能加入OpenAI的生态,并使用后者的付费API来打造自己的产品,这就等于是要依附于OpenAI。所以一旦有的选,大家显然并不希望将身家性命交付他人之手。

      而Meta此前泄露的LLama给了资源有限的创业者施展拳脚的舞台,基于LLama模型以及LoRA训练技术,开源社区也打造出了ChatLLaMa、Koala等模型。利用社区的力量群策群力最终实现极低成本下的高速迭代,这就是开源大模型的优势。就像有谷歌员工坦言的那般,“如果存在一个没有使用限制的免费高质量替代品,谁又还会为带有使用限制的产品买单呢?”

      以闭源自研产品为核心,用API或插件的形式向开发者赋能,这是OpenAI、百度的道路,也是当年苹果在iOS上所采取的策略,但入局大模型领域慢人一步的Meta已经失去了先机,因此选择开源就是试图复刻Android当年的成功路径,用开放来吸引更多人来共建生态。以史为鉴,可知兴替,这点几乎放之四海而皆准。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    TCL实业荣获IFA2024多项大奖,展示全球科技创新力量

    近日,德国柏林国际电子消费品展览会(IFA2024)隆重举办。凭借在核心技术、产品设计及应用方面的创新变革,全球领先的智能终端企业TCL实业成功斩获两项“IFA全球产品设计创新大奖”金奖,有力证明了其在全球市场的强大影响力。

    新闻

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。