Cisco heeft het afgelopen jaar hard gewerkt om zijn portfolio van Nexus-datacenterswitches aan te passen aan het tijdperk van kunstmatige intelligentie. De switches uit de Cisco N9000-serie hebben geprofiteerd van voordelen om operationele veerkracht, beveiliging en beheermogelijkheden te bieden die nodig zijn om te voldoen aan de hoge eisen van kunstmatige intelligentie in hedendaagse netwerken.
Onlangs heb ik gesproken met het Cisco-team om meer te weten te komen over hun werk met klanten in verschillende marktsegmenten, waaronder de enterprise-, telecom-, neocloud- en soevereine cloud-markten.
Het is duidelijk dat Cisco heeft ingespeeld op de snel opkomende behoeften van AI-netwerken, van back-end netwerktraining tot front-end inferentie. Kunstmatige intelligentie verandert volledige netwerkarchitecturen. Klanten moeten nadenken over welke netwerken nodig zijn om AI te ondersteunen, of dit nu in de kern, aan de rand of daartussenin is. Ze moeten ook rekening houden met de impact die AI-toepassingen zullen hebben op bedrijfsnetwerken, datacenters, operaties en governancestrategieën.
Een veranderend gesprek
Je zou je kunnen afvragen: wat is er nodig voor deze evolutie? Heel eenvoudig: de AI-infrastructuurmarkt evolueert omdat bedrijven zich realiseren dat data en applicaties behoorlijk complex en wijd verspreid zijn, wat de rol van inferentie voor AI en de behoefte aan end-to-end netwerkconnectiviteit en waarneembaarheid benadrukt.
Surbhi Paul, directeur Data Center Networking bij Cisco, vertelde me dat Cisco zich het afgelopen jaar snel heeft aangepast aan de veranderingen in de markt.
“Het gesprek is echt veranderd”, zei Surbhi in een interview. “Zes maanden geleden vroegen mensen om meer bandbreedte. Tegenwoordig gaat het niet alleen om snelheid, maar ook om determinisme. Het netwerk maakt deel uit van de computer. GPU’s kunnen crashen door jitter. Je kunt miljoenen dollars aan kapitaaluitgaven verbranden als GPU’s milliseconden inactief blijven.”
Een gediversifieerd portfolio van de N9000-serie
Laten we wat dieper ingaan.
De N9000-serie, onderdeel van de Cisco AI Networking-oplossing, heeft een flexibele architectuur die geschikt is voor verschillende vormen van silicium en besturingssystemen, waaronder Cisco’s Silicon One- en NVIDIA Spectrum-X-technologieën. Besturingssystemen zijn ook flexibel en kunnen Cisco ACI, NX-OS of SONiC bevatten. De kenmerken van de N9000-serie zijn flexibiliteit en prestaties.
Cisco heeft ook aanzienlijke toewijding getoond aan AI-geoptimaliseerde netwerken met geleide principes om open standaarden, vereenvoudigde operaties en geïntegreerde beveiliging te omarmen.
Ten eerste ligt de nadruk op operationele veerkracht. Grote datacenters en AI-clusters stellen ongekende eisen aan het netwerk, zowel aan de back-end, waar clusters training verwerken, als aan de front-end en opslagnetwerken, waar AI-applicaties worden benaderd en verwerkt. Deze nieuwe eisen betekenen dat AI-datacenters een extreem lage latentie, bandbreedte-optimalisatie en operationele veerkracht vereisen.
In een ideale implementatie moet alles verbonden zijn via elk netwerk, of het nu front-end, back-end of opslag is. Het is essentieel om een gecentraliseerd beheerplatform te hebben. Cisco gelooft dat het integreren van waarneembaarheid, real-time applicaties en werkmonitoringmogelijkheden als onderdeel van het Nexus Dashboard-beheerplan deel uitmaakt van het raamwerk voor het garanderen van operationele veerkracht, of het nu gaat om front-end- of back-end-netwerken.
“Om de ROI te maximaliseren, moet je front-end- en back-end-netwerken niet als eilanden behandelen”, zegt Surbhi. “Je hebt stabiliteit nodig. Je kunt je beheerplan niet laten mislukken. De geheime saus voor ROI is het hebben van een uniform beheerplatform. Je moet alle prestaties uit de GPU halen. Met het uniforme bedieningsmodel kun je de GPU-downtime op nul houden.”
De N9000-serie bevat kritische veerkrachtfuncties, waaronder op prioriteit gebaseerde flow control (PFC) en expliciete congestiemeldingen (ECN), die ervoor zorgen dat AI-training en inferentieoperaties kunnen worden voltooid zonder te worden onderbroken voordat ze zijn voltooid. Maar wacht, er is meer: Cisco Intelligent Packet Flow omvat PFC- en ECN-functionaliteit.
Cisco Intelligent Packet Flow is een oplossing die is ontworpen om verkeersbeheer in grootschalige kunstmatige intelligentie en krachtige computeromgevingen te optimaliseren. Ga de uitdagingen van AI-workloads aan door geavanceerde load-balancing, congestiebewustzijn en mogelijkheden voor foutcorrectie te bieden. Belangrijke kenmerken zijn onder meer dynamische taakverdeling (DLB), gewogen kosten multi-path (WCMP), taakverdeling per pakket, op beleid gebaseerde taakverdeling, hardwareversnelde telemetrie en op fouten gebaseerd herstel.
Surbhi wijst erop dat de N9000-serie met Cisco NX-OS realtime telemetrie van de ASIC kan gebruiken om op nanosecondenschaal te monitoren. Dit zorgt ervoor dat het ECN signaleert voordat de buffers vol raken.
Naast operationele veerkracht zijn er ook beveiligingsbehoeften. U hebt beveiliging nodig die is ingebouwd in de gedistribueerde infrastructuur. Nexus omvat geavanceerde beveiliging zoals eBPF en Hypershield, wat betekent dat de netwerkstructuur kan worden beschermd met gedistribueerde beveiliging tot op Linux-kernelniveau. Ingebouwde observatie kan apps, infrastructuur en logs in realtime monitoren.
Open standaarden en flexibiliteit
Een ander belangrijk element van de N9000-serie is flexibiliteit. Deze switches maken gebruik van Standaard Ethernet technologie voor zowel front-end als back-end use cases. Het is ingebouwd in zowel de Cisco Cloud-referentiearchitectuur (CRA) als de aankomende NVIDIA-gebaseerde producten Referentiearchitectuur voor cloudpartners (NCP). Dit betekent dat klanten beide platforms kunnen kiezen op basis van de juiste toepassing en behoeften. Cisco’s nieuwe samenwerking met NVIDIA kan de Cisco N9300 voorzien van NVIDIA BlueField NIC en Cisco Silicon One, of het kan de nieuwste Cisco N9100 selecteren met NVIDIA BlueField en NVIDIA’s Spectrum-X Ethernet-switching-silicium.
Cisco loopt ook voorop bij het stimuleren van nieuwe gestandaardiseerde functies, waaronder de samenwerking met standaardorganisaties zoals de IETF en UEC om nieuwe functies en standaarden toe te voegen. Bovendien heeft het de API-gebaseerde besturing voor de N9000 bijgewerkt, zodat deze kan worden beheerd met behulp van het Nexus-framework via een cloudbeheerde service, evenals in infrastructuur-als-code-modellen door interactie met open API’s.
Belangrijkste referentiegebruiksscenario’s
Cisco wordt ondersteund door grote klantacquisities. Het heeft een uitgebreide lijst van klanten die het datacenterportfolio gebruiken voor front-end-, back-end- en opslagapplicaties.
In één voorbeeld moest een zakelijke retailer uit de Fortune 500 met 1.700 locaties een hybride AI-model gebruiken. Er was een zware gecentraliseerde trainingslast met inferenties aan de rand van duizenden winkels. Het bedrijf heeft de N9000 architectuur aangenomen en maakt gebruik van het Nexus Dashboard om alle AI-netwerkfuncties te beheren, van de centrale AI-fabriek tot de edge-bron.
Surbhi wijst erop dat dit een goed voorbeeld is van training en edge-netwerken die synchroon werken om de beste prestaties te leveren, zoals in dit voorbeeld. In dit voorbeeld gebruikt de N9000-serie ASIC real-time telemetrie om te monitoren op nanosecondenschaal. ECN-signalering zorgt ervoor dat pakketbuffers nooit vol raken.
“We zien dat klanten binnen enkele dagen inferentieclusters creëren”, zegt Surbhi. “Ze hebben iets nodig dat onmiddellijk wordt geactiveerd en een lage latentie biedt.”
Slotopmerkingen
Met aanzienlijke investeringen in het afgelopen jaar heeft Cisco aangetoond dat de N9000-serie een flexibel en operationeel geavanceerd antwoord is voor datacenter- en AI-clusternetwerktoepassingen. Met de kracht van 800G en een duidelijk plan voor 1,6T, samen met Cisco’s nieuwe geïntegreerde en uniforme Nexus Dashboard, kan de N9000-serie brede AI- of cloud-datacenteractiviteiten ondersteunen, inclusief AI-back-end-, front-end- en opslagnetwerken.








