• GPT-4o 级别!VITA-1.5:实时视觉与语音交互,1.5秒互动延迟

    2025年01月07日 15:52:47   来源:Citnews中文科技资讯

      VITA-MLLM团队最近推出了VITA-1.5,这是对VITA-1.0的重大升级,旨在提升多模态交互的实时性和准确性。

      新版本支持英语和中文,互动延迟显著降低至1.5秒,用户体验大幅提升。VITA-1.5在多个基准测试中的性能也有显著提高,语音处理能力经过深度优化,ASR错误率降至7.5。

      互动延迟大幅降低至1.5秒,提升用户体验。

      多模态性能显著提高,基准测试平均性能从59.8提升至70.8。

      语音处理能力增强,ASR错误率降低至7.5,语音识别更准确。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。