• 首页 > 产经新闻频道 > 科技资讯

    英伟达发布视觉AI Agent,能用AI总结真实世界了

    2024年11月06日 10:30:28   来源:​AIGC开放社区公众号

      全球AI领导者NVIDIA(英伟达)发布了全新开发产品——NVIDIA AI Blueprint。

      AI Blueprint主要用于开发视觉AI Agent,几乎任何行业都能开发出用于分析视频、图像的AI Agent来提升工作、监控效率等。

      例如,开发一个智能体自动监控仓库工作环境,当有工人违规工作时可以自动发出警告,同时还能回答用户问题、生成内容摘要等,支持免费下载体验。

      AI Blueprint为视觉计算开发者提供了一套完整的优化软件,用于构建和部署能够处理和理解大量实时视频流或数据档案的生成性AI Agent。

      用户可以通过自然语言提示来定制这些视觉AI Agent,而无需专业的代码,这极大降低了在各个行业和智能城市应用中部署AI Agent的门槛。

      视觉AI Agent由视觉大模型驱动,能够解释物理世界并执行推理任务。NVIDIA的AI Blueprint可以配置NVIDIA NIM微服务,开发者可以轻松替换其他VLMs、LLMs和图形数据库,并使用NVIDIA NeMo平台针对他们独特的环境和用例进行微调。

      通过使用AI Blueprint可以帮助开发者节省开在调查和优化智能城市应用的生成性AI模型上花费的数月时间。在NVIDIA GPU上部署在边缘、本地或云端,它可以极大地加速搜索视频档案以识别关键时刻的过程。

      例如,在仓库环境中,可以开发一个视觉AI Agent在工人违反安全协议时发出警报;在繁忙的交通路口,AI Agent可以识别交通事故并生成报告以帮助紧急响应工作;

      在公共基础设施领域,维护人员可以要求AI Agent审查航拍画面,识别退化的道路、铁路或桥梁,以维护安全性。

      对于视力受损的人士,视觉AI Agent可以总结视频内容,帮助他们理解视频信息。在体育赛事领域,能够自动生成赛事回顾和总结。在智能城市和交通管理方面,城市管理者可以询问关于街道活动的问题,并接收改善运营的建议。此外,这些Agent还能帮助标记大量视觉数据集,帮助开发者训练其他AI模型。

      目前,全球著名系统集成商和技术解决方案提供商,包括联想、埃森哲、戴尔科技,正在将英伟达的AI Blueprint带到全球的企业和城市,推动下一波AI应用的部署,以提高工厂、仓库、商店、机场、交通路口等地的生产力和安全性。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。