导读 tesla透露了其对一个大型计算集群的投资,该计算集群由10,000个nvidiah100gpu组成,专门为人工智能工作负载提供动力。据该公司人工智能基础...

tesla透露了其对一个大型计算集群的投资,该计算集群由10,000个nvidiah100gpu组成,专门为人工智能工作负载提供动力。

据该公司人工智能基础设施负责人timzaman介绍,该系统于本周上线,旨在处理其车队收集的海量数据,以加速全自动驾驶汽车的开发。

多年来,特斯拉一直在努力实现其车辆完全自动驾驶的目标,并已投资超过10亿美元采用基础设施来实现这一目标。

2023年7月,首席执行官埃隆·马斯克透露,该公司将在明年投资10亿美元建设dojo超级计算机。dojo基于特斯拉自己的技术,从d1开始,配备354个定制cpu内核。每个训练块模块包含25个d1,基本dojov1配置总共包含53,100个d1核心。

该公司还在2012年6月建立了一个配备5,760个nvidiaa100gpu的计算集群。但该公司最新投资的10,000个h100gpu使这台超级计算机的能力相形见绌。

据tom'shardware称,这个价值超过3亿美元的ai集群将为技术计算提供340fp64pflops的峰值性能,为ai应用提供39.58int8exaflops的峰值性能。

该出版物指出,特斯拉可使用的功率实际上超过了莱诺阿多超级计算机提供的功率,使其成为地球上最强大的计算机之一。

nvidia的是为许多世界领先的生成式ai平台提供动力的组件。这些安装在服务器中的gpu还有其他一些用例,从医学成像到生成天气模型。

特斯拉希望利用这些gpu的强大功能,更高效地处理其拥有的大量数据,以构建能够成功与人类媲美的模型。

虽然许多企业通常会依赖谷歌或微软等公司托管的基础设施,但特斯拉的超级计算基础设施都是本地的,这意味着该公司还必须维护所有这些基础设施。