• 首页 > 云计算频道 > 大模型

    AI框架LoraHub:将LoRA 模块像乐高一样组合

    2023年08月03日 14:46:15   来源:站长之家

      LoraHub 是一个 AI 框架,用于自动组合 LoRA 模块,以实现对新任务的适应性性能。

      它可以根据之前未识别任务的少量样本,自动组织合适的 LoRA 模块,并通过 LoRA 学习的方式进行训练。LoraHub 具有高性能和灵活性,可以在只有 CPU 的计算机上运行,并通过减少推理成本提高效率。它为用户提供了一个共享、访问和应用训练过的 LoRA 模块的平台,为 NLP 任务的开发和应用提供了便利。

      LoraHub 的核心功能是通过 LoRA 的模块化和可组合性,在不需要人工干预或专业知识的情况下,自动组合合适的 LoRA 模块。该方法可以利用仅有的几个样本自动组织适用于新任务的 LoRA 模块。与传统的假设特定任务的训练不同,LoraHub 可以集成满足要求的所有 LoRA 模块。这种学习技术称为 LoraHub 学习,因为它利用了现有的多个 LoRA 模块。

      该方法通过在行业标准的 BBH 基准和 Flan-T5作为底层 LLM 的基础上进行评估。结果表明,少样本的 LoraHub 学习过程可以组合适用于新任务的 LoRA 模块,并且与少样本、上下文学习相比,取得了接近的结果。与上下文学习相比,LoraHub 学习不需要将实例作为 LLM 的输入,从而大大降低了推理成本。该学习技术采用无梯度方法生成 LoRA 模块的系数,并且仅需要少量推理步骤。使用单个 A100,在不到一分钟的时间内,该方法可以在 BBH 上实现顶级性能。

      LoraHub 的学习只需要了解如何处理 LLM 推理,因此可以在只有 CPU 的计算机上进行。这种灵活性和高性能的工作方式为创建一个易于共享、访问和应用于新任务的训练过的 LoRA 模块的平台铺平了道路。研究团队希望这样的系统可以建立一个具有各种功能的可重复使用的 LoRA 模块库。该团队正在努力动态组合 LoRA 节点,以提高 LLM 的能力。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    TCL实业荣获IFA2024多项大奖,展示全球科技创新力量

    近日,德国柏林国际电子消费品展览会(IFA2024)隆重举办。凭借在核心技术、产品设计及应用方面的创新变革,全球领先的智能终端企业TCL实业成功斩获两项“IFA全球产品设计创新大奖”金奖,有力证明了其在全球市场的强大影响力。

    新闻

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。