英伟达于近日推出了适用于视频搜索和摘要的全新NVIDIA AI Blueprint,借助它,几乎所有行业的开发人员都可以构建出能够分析视频和图像内容的视觉AI智能体。
AI Blueprint为视觉计算开发者提供了一套完整的优化软件,用于构建和部署能够处理和理解大量实时视频流或数据档案的生成性AI Agent。用户可以通过自然语言提示来定制这些视觉AI Agent,而无需专业的代码,这极大降低了在各个行业和智能城市应用中部署AI Agent的门槛。
视觉AI Agent由视觉大模型驱动,能够解释物理世界并执行推理任务。英伟达的AI Blueprint可以配置NVIDIA NIM微服务,开发者可以轻松替换其他VLMs、LLMs和图形数据库,并使用NVIDIA NeMo平台针对他们独特的环境和用例进行微调。
1、AI Blueprint可以帮助开发者节省在调查和优化智能城市应用的生成性AI模型上花费的时间。
2、在公共基础设施领域,维护人员可以要求AI Agent审查航拍画面,识别退化的道路、铁路或桥梁,以维护安全性。
3、对于视力受损的人士,视觉AI Agent可以总结视频内容,帮助他们理解视频信息。
4、在体育赛事领域,能够自动生成赛事回顾和总结。
5、在智能城市和交通管理方面,城市管理者可以询问关于街道活动的问题,并接收改善运营的建议。
现在,埃森哲、戴尔科技、联想等全球系统集成商和技术解决方案提供商正在将这一适用于视觉搜索和摘要的NVIDIA AI Blueprint带给全球的企业和城市,加速下一代AI应用的发展。这些AI应用可大幅提高工厂、仓库、商店、机场、交通路口等场所的生产力和安全性。