Comment construire des fermes d’IA ou de ML sans se ruiner

WRITTEN BY

erik.hoeboer@netgear.com

Le cluster est l’endroit où les choses peuvent devenir soit très coûteuses, soit limiter les performances de l’IA, ou les deux. Examinons les composants matériels typiques utilisés et déterminons où vous pouvez optimiser pour obtenir le meilleur rapport performance/prix.

Serveurs IA

Ce sont les bêtes de somme d’une ferme de serveurs IA. Et vous en avez besoin de beaucoup. Ces serveurs ont généralement des CPU puissants et sont souvent équipés de GPU ou d’accélérateurs spécialisés comme les TPU (Tensor Processing Units), conçus spécifiquement pour les tâches de traitement parallèle courantes dans l’apprentissage automatique et l’apprentissage profond. Il n’y a pas de compromis ici. La puissance de calcul brute des serveurs fera ou défera votre cluster IA.

Systèmes de stockage IA

Les applications IA nécessitent souvent l’accès à de grands ensembles de données. Les solutions de stockage dans une ferme de serveurs peuvent inclure des SSD pour un accès rapide, des HDD pour des données plus volumineuses et moins fréquemment accédées, ainsi que du stockage en réseau (NAS) ou des réseaux de stockage (SAN) pour des solutions de stockage partagées. Heureusement, ces systèmes ont été banalisés, et il existe beaucoup de choix pour tous les budgets.

Commutateurs de matériel réseau IA

NETGEAR SwitchesLes commutateurs à large bande passante et à faible latence sont cruciaux pour gérer les exigences de trafic intense d’une ferme de serveurs. Ils sont souvent le goulot d’étranglement de tout le transport de données dans une configuration IA. Puisque vous ne pouvez pas faire de compromis sur les performances de débit ou la faible latence, c’est un domaine où vous pourriez trouver que la nouvelle série de commutateurs réseau M4350 de NETGEAR de 10GbE/100GbE est particulièrement salvatrice.

Ces commutateurs fonctionnent sur le silicium le plus moderne, à faible latence et haute performance, et sont également conçus avec simplicité dans la gestion et les clients soucieux des coûts à l’esprit. Les fabricants de commutateurs de centres de données d’entreprise typiques ont rendu leurs produits inabordables, en faisant un mauvais pari.

Les routeurs gèrent le trafic entre la ferme de serveurs et l’Internet plus large ou d’autres réseaux. Il en va de même ici ; ils pourraient être le goulot d’étranglement avec le trafic vers/depuis Internet. Cependant, des alternatives rentables sont disponibles, telles que le routeur professionnel PR60X de NETGEAR avec des performances WAN/LAN multi-gig/10gig.

Les cartes d’interface réseau (NIC), éventuellement avec un débit de 10GbE /100GbE, sont essentielles pour une communication rapide entre serveurs. Elles doivent être optimisées pour les commutateurs que vous choisissez. L’équipe d’ingénierie de NETGEAR peut vous aider à concevoir une configuration réseau optimale avec ces composants.

Le logiciel de gestion de réseau est souvent oublié, mais il est crucial pour gérer les configurations de réseau, surveiller les performances du réseau, dépanner et assurer la sécurité du réseau. NETGEAR offre un contrôleur gratuit, appelé NETGEAR Engage, pour gérer et surveiller un petit ou un grand nombre de commutateurs entièrement gérés de NETGEAR.

Exemples de fermes d’IA et de ML

Les commutateurs NETGEAR sont utilisés dans des applications d’IA/ML de classe mondiale. Deux exemples :

  • Cluster d’IA/ML pour analyser des milliers de flux de caméras simultanés de voitures autonomes par une société d’analyse de données tierce.
  • Cluster d’IA/ML pour collecter, scanner, analyser et combiner des images de caméra de drone pour l’armée d’un État membre de l’OTAN.

Avec cet aperçu, nous espérons vous avoir donné une idée générale des principales considérations dans la conception d’une configuration d’IA/ML et où nous pouvons vous aider à optimiser les performances et les coûts.

Lorsque vous avez une proposition de projet pour l’architecture de votre cluster, veuillez nous contacter pour discuter de la conception du réseau. Nous concevrons votre réseau gratuitement et garantissons son bon fonctionnement. Lisez-en plus sur notre série de commutateurs M4350, adaptée aux déploiements d’IA et de ML.