英伟达发布XR AI程序库,助力开发者打造空间智能体
依托这些能力,开发者能更轻松开发具备空间感知、多模态交互的AI智能体,在AR、XR沉浸式场景中提供低延迟、贴合现场环境的实时辅助。平台整合四大核心能力:英伟达表示,具备环境感知、工具调用、企业知识库调取、人机协同能力的AI智能体已成为新型数字化劳动力。
直接打通AR硬件与AI模型
英伟达于6月16日推出了可应用于广大开发者群体的XR AI程序库 , 此次推出明显区别于单纯的软件更新 , 它直接将从AR以及XR设备所采集而来的信号 , 与AI大模型 , 企业各类数据 , 还有形形色色的各种工具进行有效联动 , 进而形成一类拥有能对环境予以感知的能力 , 具备推理功能 , 还能够实际动手开展工作的空间智能体。对于开发者而言 , 从此无需再自行拼凑多个不同系统 , 仅需一个底层基座便能够成功搞定多模态感知 , 知识库检索 , 大模型调度等一系列复杂环节。
这本就意味着, AR眼镜并非单单只是用于显示信息的屏幕了, 而是能够领会你所看见的事物, 知晓你所需要得到的东西, 进而在实时状态下给出辅助性质的指引。英伟达将往昔那种需要耗费几个月时间才能够实现集成的技术产业链条, 压缩成为了一套具备标准化特质的开发工具。
四大核心能力构成技术底座
这套程序库整合了英伟达NeMo智能体工具包, 并提供工具调用能力, 还提供推理工作流能力, 也提供多智能体协同能力。开发者能够借助这个工具包, 使AI智能体学会调用外部软件, 还能学会拆解复杂任务, 甚至能让多个AI智能体之间相互配合。在算力方面, 英伟达拿出了全系列加速硬件, 其中包括从DGX Spark到DGX工作站, 再到RTX专业图形工作站的硬件, 这些硬件覆盖了云端、数据中心和边缘端所有场景。
这些硬件赋予 XR AI 低延迟推理的能力, 保证于工厂车间或者手术室之中, AI 的反应速度能够跟得上真人操作的节拍。整个架构使得 AI 智能体不但能看见周围环境, 还能够读取企业内部的知识库, 将复杂任务逐步进行拆解, 最终输出契合现场的实际信息。
西门子率先在工业场景落地
工业领域有个实际案例已被成功实现。西门子依据英伟达的XR AI技术, 借助DGX Spark构建了一套车间辅助系统。工程师戴上轻量化AR眼镜, 能够实时排查PLC设备故障, 该系统直接推动数字孪生模型并关联自动化产线, 做出具体维保指引。以往要翻手册、打电话询问专家的流程, 如今在眼镜里一次就全部完成。
这一整套方案使得处于一线的工程师在进行维修时的效率得到了大幅度的提升, 原本以小时作为级别的故障定位时间被缩短到了以分钟作为级别的程度。西门子有着将这一套系统推广至更多工厂的计划, 要让AI智能体变成产线上的标准配置。
科研与医疗赛道同时铺开
在科研范畴之内, 有个名为Rana的公司, 发布了一款称作LabOS的科研用途之操作系统, 借由空间智能体去辅助开展干细胞以及基因编辑方面的实验工作。此系统能够自行记录具有规范性的实验流程, 并且可以兼容像Meta、Rokid、AI眼镜等众多不同种类的终端设备。对于科研工作人员而言, 无需再度手动记录每一项操作步骤, 眼镜能够自动辨认实验步骤进而进行归档, 而且在操控运行环节出现错误的时候, 会马上给出提醒。
医疗领域当中, 匹兹堡大学医学中心凭借XR AI以及DGX工作站构建外科辅助方案, 该系统能够智能地避开手术关键视野的遮挡状况, 于不干扰医生进行操作的前提条件之下, 推送出患者病史、影像数据等诊疗方面的信息, 医生在开展手术的过程当中不需要转头去看屏幕,信息会直接叠加在视野范围之内。
汽车设计与沉浸式内容同步受益
汽车设计企业凭借这套平台留存沉浸式评审数据, 戴上 AR 眼镜的设计师, 能够于三维空间内查看数字孪生模型, 多人异地评审时也可实现实时同步,以往那种需打印实车模型且占用物理空间的评审流程, 如今已全然数字化, 设计迭代速度显著加快。
知名沉浸式媒体工作室运用该技术塑造泰坦尼克号沉船交互数字场景。用户戴上AR眼镜, 站于真实空间之中, 能目睹沉船三维重建模型。通过语音实时检索古迹相关资料。此种体验使博物馆和文化场馆的展览方式产生根本变化。
空间智能体成为新型数字化劳动力
英伟达确切表明, 那种拥有环境感知、工具调用、企业知识库调取以及人机协同能力的AI智能体, 已然成了新型数字化劳动力。XR AI给工厂、医院、实验室、沉浸式内容场景提供了完整开发底座, 使得自治式AI深度融入一线实操工作。
当前, 开发者借由这组程序库,能够迅速搭建出契合自身的空间智能体应用。往后, 经由每一条生产线所涉, 每一间手术室涵盖, 每一个科研实验室包含, 皆存在配备一个知晓环境, 明白业务, 可即时行动的AI助手的可能性。
你觉得空间智能体最先会在哪个行业实现广泛应用? 请在评论区域留言, 进行点赞和分享行为方便让更多人目睹这项技术的实际价值。