AI PC挂羊头卖狗肉?大模型困于硬件瓶颈,成熟还需两三年25年米OV小屏旗舰大横评:人均小钢炮,iPhone瞬间不香了小度发布专为老年人打造的智能健康陪伴设备安克创新2024年营收净利双增,储能业务成亮点英特尔双芯锐炫 B580 48GB显卡或亮相COMPUTEX 2025《太空杀》接入豆包大模型 巨人网络与火山引擎深化AI合作简单直接才是王道! 京东家电家居“一口价”破解消费者大促痛点年中大促各平台玩法卷起来了 京东家电家居主打“一口价”简单直接智解办公痛点,质造声学标杆:iFLYBUDS Pro 3重新定义AI会议耳机自在无界,AI随行:iFLYBUDS Air 2开启全场景智能耳机革命当新能源车都不再叫智驾?自动驾驶还有未来吗?联发科的增长假象:看似甜蜜,实则暗藏玄机对淘天、京东开放外链后,小红书电商还有戏吗?国家计算机病毒应急处理中心检测发现65款违规应用 平安健康榜上有名灵境文明发布全球首个数字生命3.0标准,重新定义从“工具智能到生命智能”新纪元阿里云与DeepSeek脱颖而出,福布斯发布中国人工智能企业 TOP50榜单新一代开源视觉编码器 OpenVision 发布:超越 CLIP 与 SigLIP 的强大选择机械革命蛟龙16Pro享国补立减2000元 来京东心动购物季换新3C数码好物ChatGPT推出SharePoint连接器,企业数据分析更高效!阿里MNN神更新!移动端开源多模态AI支持Qwen-2.5,文本图像语音全搞定!
  • 首页 > 云计算频道 > 大模型

    超越GPT-4V!智谱AI第二代视觉大模型CogVLM2,19B参数跑出卓越性能

    2024年05月23日 09:29:10   来源:中文科技资讯

      继去年发布并开源VisualGLM-6B和CogVLM之后,智谱AI宣布近期将推出新一代多模态大模型CogVLM2。这款模型以其19B的参数量,在性能上接近或超越了GPT-4V。

      据悉,CogVLM2系列模型在多个关键指标上实现了显著提升,如在 OCRbench 基准上性能提升32%,在TextVQA基准上性能提升21.9%,且模型具备了较强的文档图像理解能力(DocVQA)等。此外,CogVLM2支持8K文本长度和高达1344*1344的图像分辨率,同时提供中英文双语的开源模型版本。

      CogVLM2 继承并优化了上一代模型的经典架构,采用了一个拥有50亿参数的强大视觉编码器,并创新性地在大语言模型中整合了一个70亿参数的视觉专家模块。这一模块通过独特的参数设置,精细地建模了视觉与语言序列的交互,确保了在增强视觉理解能力的同时,不会削弱模型在语言处理上的原有优势。这种深度融合的策略,使得视觉模态与语言模态能够更加紧密地结合。

      值得注意的是,尽管CogVLM2的总参数量为190亿,但实际激活的参数量仅约120亿,这得益于精心设计的多专家模块结构,显著提高了推理效率。此外,CogVLM2能够支持高达1344分辨率的图像输入,并引入了专门的降采样模块,以提高处理高分辨率图像的效率。

      在多模态基准测试中,CogVLM2的两个模型,尽管具有较小的模型尺寸,但在多个基准中取得 SOTA性能;而在其他性能上,也能达到与闭源模型(例如GPT-4V、Gemini Pro等)接近的水平。

      开发者可以通过GitHub、Huggingface、魔搭社区和始智社区下载CogVLM2的模型,团队还透露,GLM新版本会内嵌CogVLM2能力,在智谱清言App和智谱AI大模型MaaS开放平台上线。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    [No. S026]
    分享到微信

    即时

    vivo携手首届商学院戈壁友谊赛,以专业影像见证无畏征途

    2025年5月4日,首届商学院戈壁友谊赛于甘肃省酒泉市圆满举办。在这场4天121公里的戈壁征途中,vivo作为战略合作伙伴,为赛事提供手机、智能穿戴设备及定制影像服务,以技术赋能助力参赛选手与观众记录戈壁之上的热血奔赴,共同探索科技进步、商业文明与自然共生的未来路径。

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。