智东西(公众号:zhidxcom)
(资料图片)
作者 | ZeR0
编辑 | 漠影
智东西 5 月 24 日报道,作为加速计算的 " 守门员 ",自 ChatGPT 引爆生成式 AI 热潮后,NVIDIA(英伟达)凭借其旗舰计算芯片 A100 和 H100 GPU 在 AI 训练领域无出其右的地位,在生成式 AI 赛道刷满了存在感。今日,NVIDIA 又接连宣布多个合作进展,进一步为企业提供加速 AI 应用的新工具。
在微软 Build 开发者大会上,英伟达和微软展示了采用英伟达 RTX GPU 的 Windows 11 PC 和工作站的一系列改进,以满足生成式 AI 的需求。此外,NVIDIA 还宣布将 NVIDIA AI Enterprise 软件套件集成到微软的 Azure 机器学习中,以帮助企业加速推进 AI 计划。
在戴尔科技集团全球大会上,戴尔科技集团与 NVIDIA 联合发布用于安全、本地化部署生成式 AI 的 Project Helix 合作项目,旨在让企业更方便在本地构建和使用生成式 AI 模型,从而实现快速、安全交付更好的客户服务、市场情报、企业搜索等各种功能。
一、在 Windows 11 上轻松训练和部署高级 AI 模型
NVIDIA 和微软今日展示的一系列进展,包括在 Windows PC 上开发 AI 的工具、优化和部署 AI 的框架、驱动程序性能和效率的改进。这些将使开发者能够以生成式 AI 为核心,构建下一代 Windows 应用程序。
据介绍,超过 400 个 Windows 应用程序和游戏已经采用了 AI 技术,由 RTX GPU 上的 Tensor Cores 专用处理器加速。微软 Windows 芯片和系统集成公司副总裁 Pavan Davuluri 说,通过与 NVIDIA 在硬件和软件优化方面的合作,微软为开发人员提供了变革性的、高性能的、易于部署的体验。
传统上,AI 开发在 Linux 上进行,要求开发者要么双启动他们的系统,要么使用多台 PC 在其 AI 开发操作系统中工作,同时仍然需要使用到 Windows 生态系统的资源。过去几年,微软一直在探索构建直接能在 Windows 操作系统中运行 Linux 的功能,并将该功能命名为 Windows Subsystem for Linux(WSL)。
NVIDIA 与微软密切合作,为 WSL 内的整个 NVIDIA AI 软件堆栈提供 GPU 加速和支持。开发者可使用 Windows PC 来满足本地 AI 开发需求,并能用到 WSL 上 GPU 加速的深度学习框架。
由于 NVIDIA RTX GPU 在桌面工作站中提供了高达 48GB 的 RAM,能满足跑更大模型的需求。大内存也提高了 AI 模型局部微调的性能和质量。再加上相同的 NVIDIA AI 软件堆栈在 NVIDIA 数据中心 GPU 上运行,开发者也能很方便地将他们的模型推送到微软 Azure 云去进行大规模训练。
微软发布了优化 PyTorch 模型并将其转换为 ONNX 的微软 Olive 工具链,使开发者能自动利用 RTX Tensor Cores 等 GPU 硬件加速。开发者可以通过 Olive 或 ONNX 优化模型,将 Tensor Core 加速模型部署到 PC 或云端。
RTX Tensor Core 可提供的 AI 推理算力高达 1400 Tensor TFLOPS。去年 NVIDIA 一直致力于提高 DirectML 性能,以充分利用 RTX 硬件。NVIDIA 将发布 532.03 版驱动程序中的最新优化,这些优化与 Olive 优化模型相结合,可大幅提升 AI 性能。使用 Olive 优化版本的 Stable Diffusion 文转图生成器和流行的 Automatic1111 发行版,新驱动程序的性能提高了 2 倍以上。
不久后,NVIDIA 将推出新的 Max-Q 低功耗推理,用于 RTX GPU 上的 AI 工作负载。它优化了 Tensor Core 性能,同时保持 GPU 功耗尽可能低,延长电池寿命,保持系统凉爽、安静。NVIDIA 和微软正为开发人员提供多种资源,以便 Windows PC 上测试顶级生成式 AI 模型。Hugging Face 上提供了 Dolly 2.0 大型语言模型的 Olive 优化版本。面向对话式 AI 的 NVIDIA NeMo 大型语言模型的 PC 优化版本也即将推出。开发者还可以学习如何端到端优化他们的应用程序,以通过 NVIDIA AI 充分利用 GPU 加速来加速应用程序开发人员站点。
微软 Windows 平台和 NVIDIA 动态 AI 硬件和软件堆栈背后的互补技术将帮助开发者快速轻松地在 Windows 11 上开发和部署生成式 AI。
二、NVIDIA AI 企业软件 +Azure 机器学习,加速企业就绪的生成式 AI
除了方便开发者在 PC 上部署生成式 AI 应用外,NVIDIA 还宣布将 NVIDIA AI Enterprise 软件套件集成到微软的 Azure 机器学习中,以创建一个安全、企业就绪的平台,使全球 Azure 客户能够使用 NVIDIA AI 平台的软件层 NVIDIA AI Enterprise 全面支持的 100 多个 NVIDIA AI 框架和工具来快速构建、部署并管理应用程序。
通过 Azure 机器学习上集成的 NVIDIA AI Enterprise,用户还能够访问最高性能的 NVIDIA 加速计算资源,来加快 AI 模型的训练和推理。NVIDIA AI Enterprise 与 Azure 机器学习形成互补,同时还包括 NVIDIA 专家的帮助和支持。
微软 AI 平台副总裁 John Montgomery 说:" 微软 Azure 机器学习用户期待的是性能最高、最安全的开发平台。Azure 机器学习与 NVIDIA AI Enterprise 软件套件的集成使我们能够满足用户的期望,让企业和开发人员能够轻松地访问他们训练和部署定制、安全的大型语言模型所需的一切。"
NVIDIA AI Enterprise 包含 100 多个框架、预训练模型和开发工具,例如 NVIDIA RAPIDS 用于加速数据科学负载,NVIDIA Metropolis 可加速视觉 AI 模型开发,NVIDIA Triton Inference Server 支持企业实现标准化的模型部署和执行,NVIDIA NeMo 大型语言模型框架用于构建主题鲜明、安全可靠的生成式 AI 聊天机器人。
NVIDIA AI Enterprise 与 Azure 机器学习的集成目前为有限技术预览版,可通过在 NVIDIA 社区中注册获得。NVIDIA AI Enterprise 还可在 Azure Marketplace 上使用,为全球企业提供了一个全面安全和完全支持的 AI 开发和部署的新选项。
此外,NVIDIA Omniverse Cloud 平台即服务现已在 Microsoft Azure 上提供面向企业的私有版本。Omniverse Cloud 为开发者和企业提供了一个全栈云环境,用于大规模设计、开发、部署和管理工业元宇宙应用。
三、NVIDIA 与戴尔联手,让企业安全本地化部署生成式 AI
在戴尔科技集团全球大会上,戴尔科技集团与 NVIDIA 宣布了一个基于戴尔和 NVIDIA 基础设施与软件打造的合作项目 Project Helix。
Project Helix 将提供一系列包含技术专长和预构建工具的全栈式解决方案。通过戴尔提供的经过测试和优化的软硬件产品组合,该项目极大简化了企业生成式 AI 的部署,助力企业在保持数据隐私的同时,将数据转化为更加智能和更高价值的成果,更轻松、负责任、准确地快速部署定制化的生成式 AI 应用。
戴尔科技集团副董事长兼联席首席运营官 Jeff Clarke 说:"Project Helix 为企业提供特制的 AI 模型,使企业可以更加快速、安全地从目前还未被充分利用的大量数据中获得价值。通过高度可扩展的高效基础设施,企业可以创造出新一批生成式 AI 解决方案,重塑他们所在的行业。"
NVIDIA 创始人兼首席执行官黄仁勋谈道,NVIDIA 与戴尔科技集团一起设计出极具可扩展性的高效基础设施,使企业能够安全使用自己的数据来构建和运行生成式 AI 应用,从而推动业务的变革。
Project Helix 将支持从基础设施配置、建模、训练、微调、应用开发和部署一直到部署推理和精简结果等整个生成式 AI 的生命周期。
Dell PowerEdge 服务器针对提升生成式 AI 训练和 AI 推理性能做了优化,如采用 NVIDIA H100 Tensor Core GPU 和 NVIDIA 先进网络技术的 PowerEdge XE9680 和 PowerEdge R760xa。企业可将该基础架构与 Dell PowerScale 和 Dell ECS Enterprise Object Storage 等具有弹性、可扩展的非结构化数据存储搭配使用,进而使用戴尔服务器和存储软件中的企业功能,以及 Dell CloudIQ 软件提供的可观测能力。
Project Helix 包含 NVIDIA AI Enterprise 软件,可提供用于整个 AI 生命周期的工具;并将安全和隐私功能内置在基础组件中,如 Secured Component Verification。基于 Project Helix 项目的 Dell Validated Designs 将从今年 7 月起通过传统渠道和 APEX 灵活的消费选项提供。
结语:生成式 AI 应用浪潮正加速推动企业创新
生成式 AI 正以 AI 聊天机器人、图像生成应用、游戏渲染等形式迅速开创计算生产力的新时代。微软 Windows 芯片和系统集成公司副总裁 Pavan Davuluri 认为,AI 将成为未来几年 Windows 客户创新的最大推动力。
随着生成式 AI 应用浪潮的到来,企业正在寻求安全的加速工具和服务,以推动创新。在 NVIDIA 创始人兼首席执行官黄仁勋看来,我们正处于一个历史性时刻,生成式 AI 的惊人进步与企业对于事半功倍的需求彼此交织。
可以看到,NVIDIA 今日宣布的一系列进展,都围绕着企业在实际业务中构建与部署 AI 模型的切实需求。经过验证的设计可以帮助企业快速大规模构建生成式 AI 基础设施。在本地保护数据,可以降低固有风险,帮助企业满足监管要求。
正如 TECHnalysis Research 总裁兼首席分析师 Bob O ’ Donnell 所言:" 企业渴望探索生成式 AI 工具给自己的组织带来的机会,但许多企业不清楚该从哪里入手。"
对于企业来说,NVIDIA 与其生态伙伴们联合推出的完善解决方案,相当于提供了一条能够充分利用自己独有资产、解决数据隐私问题、快速构建及运行定制化生成式 AI 的捷途。