Wie man KI- oder ML-Farmen baut – ohne die Bank zu sprengen

WRITTEN BY

erik.hoeboer@netgear.com

Der Cluster ist der Ort, an dem es entweder wirklich teuer werden kann oder die KI-Leistung begrenzt wird – oder beides. Lassen Sie uns die typischen verwendeten Hardwarekomponenten überprüfen und bestimmen, wo Sie das beste Verhältnis von Leistung zu Kosten optimieren können.

KI-Server

Das sind die Arbeitspferde einer KI-Serverfarm. Und Sie brauchen eine Menge davon. Diese Server haben in der Regel leistungsstarke CPUs und sind oft mit GPUs oder spezialisierten Beschleunigern wie TPUs (Tensor Processing Units) ausgestattet, die speziell für die parallelen Verarbeitungsaufgaben konzipiert sind, die im maschinellen Lernen und tiefen Lernen üblich sind. Hier gibt es keine Kompromisse. Die rohe Rechenleistung der Server wird Ihre KI-Cluster machen oder brechen.

KI-Speichersysteme

KI-Anwendungen erfordern oft Zugang zu großen Datensätzen. Speicherlösungen in einer Serverfarm können SSDs für schnellen Zugriff, HDDs für größere, weniger häufig abgerufene Daten und netzwerkgebundene Speicher (NAS) oder Speichernetzwerke (SAN) für gemeinsame Speicherlösungen umfassen. Glücklicherweise wurden diese Systeme kommerzialisiert, und es gibt viele Auswahlmöglichkeiten für jedes Budget.

KI-Netzwerkhardware-Switches

NETGEAR SwitchesHochbandbreiten-, niedriglatenz-Switches sind entscheidend für die Bewältigung der intensiven Verkehrsanforderungen einer Serverfarm. Sie sind oft der Engpass aller Datentransporte in einer KI-Einrichtung. Da Sie bei der Durchsatzleistung oder niedrigen Latenz keine Kompromisse eingehen können, ist dies ein Bereich, in dem Sie die neuen M4350-Serien von 10GbE/100GbE-Netzwerkswitches von NETGEAR als besonderen Lebensretter empfinden könnten.

Diese Switches laufen auf dem modernsten, niedriglatenz-, hochleistungsfähigen Silizium und sind auch mit Einfachheit in der Verwaltung und kostenbewussten Kunden im Sinn gebaut. Hersteller von typischen Unternehmens-Datencenter-Switches haben ihre Produkte unerschwinglich gemacht, was sie zu einer schlechten Wahl macht.

Router verwalten den Verkehr zwischen der Serverfarm und dem breiteren Internet oder anderen Netzwerken. Das Gleiche gilt hier; sie könnten der Engpass mit dem Verkehr zum/vom Internet sein. Es gibt jedoch kostengünstige Alternativen, wie z.B. den PR60X Professional Router von NETGEAR mit Multi-Gig/10Gig WAN/LAN-Leistung.

Netzwerkkarten (NICs), möglicherweise mit 10GbE /100GbE-Durchsatz, sind wesentlich für eine schnelle Serverkommunikation. Sie müssen für die von Ihnen gewählten Switches optimiert werden. Das Engineering-Team von NETGEAR kann Ihnen helfen, eine optimale Netzwerkkonfiguration mit diesen Komponenten zu entwerfen.

Netzwerkmanagement-Software wird oft vergessen, ist aber entscheidend für die Verwaltung von Netzwerkkonfigurationen, die Überwachung der Netzwerkleistung, die Fehlersuche und die Gewährleistung der Netzwerksicherheit. NETGEAR bietet einen kostenlosen Controller namens NETGEAR Engage an, um kleine oder große Mengen von NETGEAR Fully Managed Switches zu verwalten und zu überwachen.

KI- & ML-Farmbeispiele

NETGEAR-Switches werden in weltklasse KI/ML-Anwendungen verwendet. Zwei Beispiele:

  • KI/ML-Cluster zur Analyse von Tausenden von gleichzeitigen Kamerafeeds selbstfahrender Autos durch ein Drittanbieter-Datenanalyseunternehmen.
  • KI/ML-Cluster zur Sammlung, Überprüfung, Analyse und Kombination von Drohnenkameraaufnahmen für das Militär eines NATO-Mitgliedstaates.

Mit dieser Übersicht hoffen wir, Ihnen eine hochrangige Vorstellung von den Hauptüberlegungen bei der Gestaltung einer KI/ML-Einrichtung gegeben zu haben und wo wir Ihnen helfen können, Leistung und Kosten zu optimieren.

Wenn Sie einen Entwurfsvorschlag für die Architektur Ihres Clusters haben, kontaktieren Sie uns bitte, um das Netzwerkdesign zu besprechen. Wir werden Ihr Netzwerk kostenlos entwerfen und garantieren, dass es korrekt funktioniert. Lesen Sie mehr über unsere M4350-Serie von Switches, die für KI- & ML-Bereitstellungen geeignet sind.