• 首页 > 云计算频道 > 大模型

    微软Azure OpenAI支持数据微调啦!可打造专属ChatGPT

    2023年10月19日 10:36:18   来源:微信公众号 AIGC开放社区

      本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区。

      10月17日,微软在官网宣布,现在可以在AzureOpenAI公共预览版中对GPT-3.5-Turbo、Babbage-002和Davinci-002模型进行数据微调。

      使得开发人员通过自己的数据集,便能打造独一无二的ChatGPT。例如,通过海量医疗数据进行微调,构建专注医疗领域的ChatGPT助手,可询问与医疗相关的病历、专业术语、治疗方案等内容。

      目前,全球各行业积累了几年甚至几十年的巨量优质数据,如何高效利用、查询这些数据成为一大难题。

      通过自有数据微调打造的AI助手可有效解决这一痛点,同时提升内容的准确性、安全性,是组织实现降本增效的利器。

      什么是数据微调

      大模型数据微调(Fine-tuning)是一种迁移学习方法,用于深度学习和机器学习。通常数据微调是基于一个预训练好的模型(例如,GPT-3.5-Turbo)作为基石,然后在特定的任务数据集(例如,法律、医疗、营销)上进行额外的训练,使模型能生成特定业务领域的内容。

      例如,你想训练一个模型来回答法律相关的问题,首先在大量的通用文本数据上进行预训练,然后在医学问答数据集上进行微调。

      简单来说,微调功能就是让ChatGPT,完全按照你的数据来生成内容。

      需要注意的是,即便你有高质量的数据集,但选择的微调模型性能很差,生成的内容也不会很理想。

      而微软提供基于OpenAI的GPT-3.5-Turbo,是一个经过全球数百万开发者验证的高性能成熟模型。

      Azure OpenAI新功能

      Babbage-002和Davinci-002是微软最新推出的GPT-3基础模型,可生成文本、代码等,没有接受过遵循指令的训练。但在微调、托管服务费用方面更便宜。

      Babbage-002取代了已弃用的Ada和Babbage 模型, Davinci-002则取代了Curie和 Davinci。

      GPT-3.5-Turbo是OpenAI性能最成熟模型之一,支持多轮深度对话、创建微调数据集、训练和部署等一站式开发服务。

      Azure OpenAI微调功能演示

      上传数据:微软在Azure OpenAI内置了数据过滤功能,当检测到用户上传的数据集包含非法、歧视等有害信息时,会自动删除这些内容。以下是上传数据集代码示例。

      预训练:使用指定模型、训练和验证数据,并设置相应的参数。开发者可将Azure OpenAI Studio用于简单的GUI,或者使用微软的REST API或OpenAI Python SDK。

      开始启动微调功能。

      完成微调后,将返回评估指标,例如,训练和验证损失等参数。

      目前,微软提供数据微调托管服务,用户无需担心任何算力资源问题,只需要选择时间即可。

      收费标准:Babbage-002为34美元/小时;Davinci-002为68美元/小时;GPT-3.5-Turbo为102美元/小时。

      3)Azure OpenAI 服务中的推理托管:当用户完成微调后,就可以使用模型生成专属内容了。

      如果你没有足够的算力资源平台来支撑模型的日常输出,微软同样提供了托管服务。

      收费标准:Babbage-002托管每小时1.7美元,Davinci-002每小时1.7美元,GPT-35-Turbo,每小时7美元。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    TCL实业荣获IFA2024多项大奖,展示全球科技创新力量

    近日,德国柏林国际电子消费品展览会(IFA2024)隆重举办。凭借在核心技术、产品设计及应用方面的创新变革,全球领先的智能终端企业TCL实业成功斩获两项“IFA全球产品设计创新大奖”金奖,有力证明了其在全球市场的强大影响力。

    新闻

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。