10.3 On-Premises: OpenShift 4.10-Setup - Installer Provisioned Infrastructure (IPI) auf vSphere
277
10.3.1 Preflights: Infrastruktur und OpenShift-Cluster
277
10.3.2 Generelle Tool-Hinweise zu allen OpenShift-Setups (AWS, GCP, vSphere & Co.)
277
10.3.3 Der OpenShift-Installer: Terraform in schön
278
10.3.4 Vorbetrachtungen: Cluster Sizing
279
10.3.5 Zusammenfassung der technischen Preflights für das vSphere-Setup
279
10.3.6 Achtung, wichtig: DNS-Settings
280
10.3.7 DNS-Reverse-Zonen
281
10.3.8 vSphere-HA und OpenShift-Installer (OVA Upload fails in Single Datastore)
281
10.3.9 install-config.yaml für vSphere-IPI-Installation (Auszüge)
282
10.3.11 Der Post-Rollout-Zustand
286
10.6 vGPU-/MIG-spezifisches Setup des OpenShift-Clusters: NFD- und GPU-Operator
306
10.6.1 Historisches - NVIDIA-Driver-Build mit Red Hat Entitlements
306
10.6.2 Kernel für Driver-DaemonSet zu neu? Achtung bei OpenShift-Release-Updates
307
10.6.3 Installationsverfahren, generelle Operator-Settings
307
10.6.4 GPU-Manager-managed MIG-Mode und vGPU
308
10.6.5 NFD-Operator-Installation und -Konfiguration
308
10.6.6 GPU-Operator-Installation und -Konfiguration
311
10.6.7 License-ConfigMap
313
10.6.8 ImagePullSecret für Driver-Images aus der NGC-Registry
315
10.6.9 Die ClusterPolicy-CR (GPU-Operator)
316
10.9 Cloud: GPU-MachineSets in OpenShift 4.10 unter GCP mit A100-Instanzen (MIG-Partitionen via Operator)
333
10.9.1 Vorbetrachtungen
333
10.9.2 Verfügbare VM-Instanzen (GCP) mit GPU
334
10.9.3 Setup-Prozeduren - schematisch
334
10.9.4 Preflights - GCP-Kontingente gegebenenfalls erhöhen
335
10.9.5 Preflights - Domain, DNS und APIs
335
10.9.6 Service-Account zur OpenShift-Cluster-Erzeugung
337
10.9.7 Anpassungen der install-config.yaml, Rollout des Clusters
338
10.9.8 Setup der GPU-Nodes
341
10.9.9 Extraktion, Anpassung und Re-Import MachineSet und MCP
342
10.9.10 Skalierung des neuen GPU-MachineSets
345
10.9.11 Check der provisionierten GPU-Nodes
346
10.9.12 NFD- und GPU-Operator
346
10.9.13 MIG-Mode aktivieren, MIG-Partition-Size für A100 einstellen
348
10.9.14 Debugging und Troubleshooting
352