世界首座、时速 350 公里,我国汕汕高铁汕头湾海底隧道贯通 中乔体育新「燥」型网球系列:解锁春日运动时尚,无网不乐芒果 TV 宣布调整会员同时使用设备数:新会员降至 1 台TrendForce:2025 年二季度一般型 DRAM 内存价格环比跌幅预计收敛至 5% 以内戴尔科技本财年裁员规模达 10%,重申多元化及包容性中乔体育新「燥」型网球系列:解锁春日运动时尚,无网不乐百川精简医疗团队,AI医疗的金矿不好挖保时捷2026款新车将搭载升级版PCM系统,集成Alexa与Dolby Atmos音效微软推出全新People与File Search应用 优化企业办公效率索尼Xperia 1 VII规格曝光:4K屏幕回归,或搭载2亿像素主摄戴尔科技员工总数减少10% 重申多元化承诺不变Epomaker推出采用凯华电感轴的Magcore 87机械键盘清华大学开源 Video-T1:无需重新训练 AI视频秒变高清大片腾讯云宣布上线DeepSeek最新版V3模型API接口推客怎么开通?官方提醒:平台不会对推客收取任何费用美图WHEE全新上线「证件照」功能零成本拍爆款!AI电商视频生成神器Product Anyshoot来了腾讯混元T1正式版和DeepSeek V3-0324上线2025DSG全球供应链创新论坛圆满落幕百余家供应商联合倡议支持哪吒汽车化债复工复产 世界首座、时速 350 公里,我国汕汕高铁汕头湾海底隧道贯通 中乔体育新「燥」型网球系列:解锁春日运动时尚,无网不乐芒果 TV 宣布调整会员同时使用设备数:新会员降至 1 台TrendForce:2025 年二季度一般型 DRAM 内存价格环比跌幅预计收敛至 5% 以内戴尔科技本财年裁员规模达 10%,重申多元化及包容性中乔体育新「燥」型网球系列:解锁春日运动时尚,无网不乐百川精简医疗团队,AI医疗的金矿不好挖保时捷2026款新车将搭载升级版PCM系统,集成Alexa与Dolby Atmos音效微软推出全新People与File Search应用 优化企业办公效率索尼Xperia 1 VII规格曝光:4K屏幕回归,或搭载2亿像素主摄戴尔科技员工总数减少10% 重申多元化承诺不变Epomaker推出采用凯华电感轴的Magcore 87机械键盘清华大学开源 Video-T1:无需重新训练 AI视频秒变高清大片腾讯云宣布上线DeepSeek最新版V3模型API接口推客怎么开通?官方提醒:平台不会对推客收取任何费用美图WHEE全新上线「证件照」功能零成本拍爆款!AI电商视频生成神器Product Anyshoot来了腾讯混元T1正式版和DeepSeek V3-0324上线2025DSG全球供应链创新论坛圆满落幕百余家供应商联合倡议支持哪吒汽车化债复工复产
  • 首页 > 云计算频道 > 大模型

    浙大校友联手微软开源LLaVA-1.5,硬刚GPT-4V

    2023年10月08日 15:22:37   来源:站长之家

      LLaVA-1.5是来自威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究人员近期开源的一款全新的端到端多模态大模型,可与OpenAI的GPT-4V形成正面竞争。LLaVA-1.5在11项基准测试中都实现了新的状态最优(SOTA)成绩,包括视觉问答、图像 caption等任务,展现出了强大的多模态理解能力。

      相比之前的版本LLaVA,LLaVA-1.5采用了更高分辨率的图像输入、更大规模的语言模型(13B参数),以及面向学术任务的视觉问答数据集,从而获得了显著的性能提升。研究人员发现,与额外的大规模预训练相比,视觉指令微调对提高多模态能力更为关键。

      值得一提的是,LLaVA-1.5采用了最简单的架构设计,只需要在公开可取得的6百万图像文本配对上训练一个全连接层,就能在多项基准测试中打败复杂的SOTA系统,刷新记录。使用8块A100GPU,LLaVA-1.5的训练仅需1天时间即可完成。LLaVA-1.5展示了开源大模型可以通过简单的设计和公共数据取得竞争力,为未来的研究提供了有价值的经验。LLaVA-1.5以其出色的多模态理解能力,向业内掀起了一股“硬刚GPT-4”的新风潮。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。