Brave搜索推出AI对话功能,打造搜索引擎新体验西班牙BBVA银行成功部署ChatGPT企业版 五个月创建2900个GPTsAI2开源训练方案Tülu 3,打破大模型后训练技术垄断亚马逊投资1.1亿美元用于Trainium芯片的AI 研究数据既要利用又要保护,安恒信息在互联网之光博览会上拿出一份AI+方案AI助力800年古迹浴火重生!时隔5年,巴黎圣母院终于完成修复三星推出全新 Gauss 2 AI 模型或将成为下一个Galaxy大脑微软公测 Translator Pro 翻译应用:打破职场语言障碍,可本地运行微软重拳出击:捣毁大型网络钓鱼平台 ONNX,斩断 240 个恶意域名专攻财务人员!“银狐”木马病毒出现新变种:通过微信、QQ群传播营收达 351 亿美元!黄仁勋认为英伟达股价将继续上涨的三个原因消息称亚马逊面临欧盟调查:是否在电商市场偏袒自有品牌产品智能手机2024收官在即,华为扔出王炸强势收尾消息称苹果正评估电视新品类,智能家居是关键为产业经济插上“数字羽翼”,魔珐有言AIGC“3D视频创作大赛”成功举办首款纯血鸿蒙TWS耳机!华为FreeBuds Pro 4宣布11月26日发布首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务“闲置经济”成新消费趋势,万物新生长期成长性如何?阿里整合电商业务,电商迎来终局一战?为什么在拼多多诞生了第1500亿个快递?
  • 首页 > 云计算频道 > 大模型

    小米补课大模型

    2023年10月08日 13:41:40   来源:AI蓝媒汇

      讲真,小米最近在AI大模型上的速度,比造车要快。

      越想听小米汽车的动向,雷军越不说。憋到十月一号国庆假期这天,放了个大招——还是关于大模型的。

      十月一日这天的消息是,雷军投资了王小川的大模型公司百川智能。后者今年 3月成立,说要“构建中国最好的大模型底座”,还要在年底追平GPT-3.5。

      其最新的版本还通过了《生成式人工智能服务管理暂行办法》备案,正式上线面向公众提供服务,可以说在国产大模型领域,百川的速度很快。

      当然雷军也不慢,这次投资百川智能属于A+轮,据说,之前一轮雷军也投了。在大模型上,雷军不仅下手快,目标还多,另外两个知名的国产大模型公司智普AI和minimax也得到了他的垂青。

      此外,小米还有自己的AI智能团队,研发人员比百川智能整个公司的人还多,而其公布的2023年Q2财报上说,研发费用达到了46亿。

      虽然,小米的高层曾表态:“小米不做通用大模型“,但无论是” 跑通端侧大模型“,还是接连押注通用大模型公司,雷军的AI野心,着实不小。

      百川抱大腿

      3月份成立的百川智能,比小米大模型团队早了一个月。

      王小川领衔,团队里有不少搜狗的旧部,磨合起来异常顺利,一些老员工甚至感觉:只是换了个地方办公。

      5月,百川智能就诞生了第一款大模型Baichuan-7B,然后一个月更新一次,到了9月,530亿参数的闭源Baichuan2-53B,已经开始进军To B了。

      百川智能看起来一切顺利,又有王小川这个金字招牌,融资也是顺水推舟,但国内的大模型市场今年以来一直处在风口,一大群科技互联网公司都挤在一起分一杯羹,百川人强马快,但现实并不是特别美好。

      首先,大模型实在太多了。

      中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示,截止到今年5月,国内已经发布了79个大模型——盘古、悟道、文心一言、通义千问、星火认知……还有一堆名字奇怪的模型,百川智能夹在里面,竞争压力相当之大。

      其次,大模型这东西,一旦干起来就需要多如牛毛的显卡芯片、算力和不停迭代的技术,这些都换算成钱,就一个字——烧。

      因此,王小川需要雷军。

      恰好雷军不仅有钱,关键还懂技术,小米在大模型这一领域,拥抱出一个手机上运行的模型,雷军虽然不做通用模型,但从独角兽到百川这样的实力派创业公司,给钱真是没有犹豫过。

      小米的野心

      在大模型上,小米是有野心的——并不比造车差。

      8月,雷军在舞台上喊出“小米全面拥抱大模型“后,就拿出了一款“端侧”的轻量大模型——“端侧”,是指模型服务不是部署在云端,而是直接存储在手机设备内部的芯片中,仅利用芯片的算力生成结果。

      小米这样做是有原因的。

      今年5月份的谷歌I/O大会上,谷歌一口气发布了四个新一代大语言模型 PaLM 2。其中最小的“壁虎”大模型,可以适配手机运行。而 “壁虎”也被称赞为PaLM 2模型中 “最重要的亮点”——这与小米的端侧轻量化模型相得益彰。

      雷军显然知道,在大模型混乱的战场上,端侧轻量化并适配手机的模型,另辟蹊径,却能为助推手机销量乃至小米高端化策略,打开新的局面。

      小米高级副总裁、手机部总裁曾学忠也认为,AI和手机的端侧结合可能成为下一次跨越。AI让设备能够真正“理解”人,从而让人与设备更进一步结合。

      而另一方面,通用模型表面上没有被小米“拥抱”,实际上也不能少,毕竟未来的小米汽车和其他硬件产品的人机对话、语义理解,都需要得到通用大模型来加持。

      而对于更长远的科技硬件军备竞赛,小米面临着和百川智能同样的压力。

      如今苹果、华为、三星、OV、荣耀等几乎所有头部厂商都先后宣布了落地,或将要落地大模型,小米依靠自研+投资双管齐下的布局,要在其中杀出一条血路非常艰难。

      但是对于小米来说,即便它并不想成为下一个OpenAI,也必须得投出下一个OpenAI

      来源|AI蓝媒汇 作者|黑羊

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。