Invoering
De voortdurende ontwikkeling van AI-toepassingen blijft indrukwekkend. Bedrijven die eerder overwogen om gebruik te maken van de geavanceerde voorspellende en natuurlijke taalmogelijkheden van AI, overwegen nu om AI-systemen te adopteren die toegang hebben tot interne gegevens, complexe beslissingen kunnen nemen en een hoge mate van autonomie hebben.
Terwijl we blijven streven naar grenzen van kunstmatige intelligentie, is het van cruciaal belang om een fundamenteel concept van informatiebeveiliging in gedachten te houden: hoe krachtiger en capabeler een systeem is, hoe aantrekkelijker het wordt voor tegenstanders. 84% van de bedrijven heeft het afgelopen jaar gemeld dat ze te maken hebben gehad met een AI-gerelateerd beveiligingsincident; dit aantal zal alleen maar toenemen.
Om bedrijven te beschermen tegen het complexe en dynamische AI-risicolandschap, heeft Cisco AI Defense geïntroduceerd. Eén van de kenmerken van dit landschap is de snelle evolutie, aangezien zowel onderzoekers als aanvallers nieuwe kwetsbaarheden en technieken ontdekken om AI te omzeilen. In tegenstelling tot traditionele softwarekwetsbaarheden die kunnen worden aangepakt met patches, maken AI-aanvallen gebruik van de fundamentele aard van natuurlijke taalverwerking, waardoor zero-day-preventie onmogelijk wordt met bestaande benaderingen. Dit heeft ons geleid tot het ontwikkelen van een meerfasig systeem dat AI-dreigingsinformatie omzet in actieve, geïntegreerde AI-bescherming.
In deze blog zullen we de fasen van dit raamwerk onderzoeken, de impact en het belang ervan bespreken, en een concreet voorbeeld delen van een bedreiging die snel is geoperationaliseerd.
Ons raamwerk
Op hoog niveau zijn er drie fasen in ons dynamische, door AI aangedreven beveiligingssysteem: operaties voor bedreigingsinformatie, uniforme gegevenscorrelatie en releaseplatform. Elke stap is zorgvuldig ontworpen om snelheid, nauwkeurigheid en stabiliteit in evenwicht te brengen, zodat bedrijven die AI Defense gebruiken, zonder enige wrijving kunnen profiteren van tijdige bescherming.

Het verzamelen van AI-bedreigingsinformatie
De Threat Intelligence Operations vormen de eerste verdedigingslinie in ons snellereactiesysteem, waarbij het internet en niet-openbare bronnen voortdurend worden gecontroleerd op AI-gerelateerde bedreigingen. Ruwe aanvals- en kwetsbaarheidsinformatie wordt omgezet in bruikbare bescherming via een pijplijn die de nadruk legt op automatisering, prioritering en snelle ontwikkeling van handtekeningen.
Hoewel informatie wordt verzameld uit verschillende bronnen (academische artikelen, beveiligingsfeeds, intern onderzoek en meer), is het onmogelijk om te voorspellen welke aanvallen zich daadwerkelijk zullen verspreiden. Om onze inspanningen te prioriteren, gebruiken we een algoritme dat verschillende factoren onderzoekt, zoals aanvalstypen of -patronen, haalbaarheid van implementatie, uitvoerbaarheid van de aanval en gelijkenis met bekende aanvallen. Prioritaire bedreigingen worden geëvalueerd door menselijke analisten, geholpen door LLM, en uiteindelijk worden detectiehandtekeningen ontwikkeld.
De ontwikkeling van onze handtekeningen is gebaseerd op zowel YARA-regels als diepere ML-modeltraining. Dit stelt ons in staat om tijdig bescherming te bieden tegen nieuw geïdentificeerde bedreigingen, terwijl we werken aan diepere, uitgebreidere verdedigingen.
Consolideer een centraal dataplatform
Het doel van ons dataplatform is om één enkele locatie te bieden voor alle gegevensopslag, aggregatie, verrijking, labeling en besluitvorming. Informatie uit meerdere bronnen wordt systematisch samengevoegd en gecorreleerd in een datameer, waardoor een uitgebreide artefactanalyse wordt gegarandeerd via een geconsolideerde gegevensrepresentatie. Deze gegevens omvatten klanttelemetrie indien toegestaan, openbaar beschikbare datasets, door mensen en sjablonen gegenereerde labels, snelle vertalingen en meer.
Het belangrijkste voordeel van deze geconsolideerde gegevensopslag is dat deze één gecentraliseerde bron van waarheid biedt voor al onze daaropvolgende bedreigingsworkflows, zoals menselijke analyse, gegevenslabeling en modeltraining.
Implementatie van productieklare beveiligingen
Een van de grootste uitdagingen bij het bouwen van een systeem voor het detecteren en blokkeren van bedreigingen, zoals onze AI-vangrails, is het bijwerken van de detectiecomponenten na de release. Onverwachte veranderingen in de distributie van detecties kunnen catastrofale hoeveelheden valse positieven genereren en de kritieke infrastructuur van klanten beïnvloeden. We hebben ons platform specifiek met deze risico’s in gedachten ontworpen, met behulp van bedreigingssignaturen, ML-detectiemodellen en geavanceerde detectielogica om snelheid en veiligheid in evenwicht te brengen.
Onze releaseplatformarchitectuur ondersteunt gelijktijdige implementaties van meerdere onveranderlijke guardrail-releases binnen dezelfde implementatie. In plaats van bestaande vangrails direct te updaten en te vervangen, wordt er naast de oude een nieuwe versie uitgebracht. Deze aanpak zorgt voor een soepele klanttransitie en handhaaft een gestroomlijnd rollback-proces zonder de complexiteit van een conventionele releasecyclus.
Door middel van ‘schaduwimplementaties’ kunnen we veilig en grondig testen op detectieregressies in meerdere uitgebrachte versies. Zo kunnen we vertrouwen hebben in de betrouwbaarheid en effectiviteit van de vangrails wanneer ze in productie worden genomen.
Het belang van dynamische AI-beveiliging
Net zoals AI-technologie in snel tempo evolueert, geldt dat ook voor het AI-bedreigings- en kwetsbaarheidslandschap. Bedrijven hebben een dynamisch AI-beveiligingssysteem nodig om met vertrouwen AI-toepassingen te kunnen adopteren en innoveren.
De geïntegreerde architectuur van Cisco AI Defense maakt gebruik van drie onderling afhankelijke platforms om de gehele levenscyclus van bedreigingsreacties aan te pakken. Met geavanceerde dreigingsinformatieoperaties, een gevestigd dataplatform en een doordacht releaseproces balanceren we snelheid, beveiliging en effectiviteit voor AI-beveiliging. Laten we eens kijken naar een echt voorbeeld van een van deze versies.
Op 9 april werd op arXiv een meertalige gemengde adaptieve aanval voor AI-systemen uitgebracht, bekend als de ‘Sandwich Attack’. Binnen drie dagen, op 12 april, was deze techniek al geïntegreerd in onze cyberdreigingsinformatiepijplijn: nieuwe aanvalsvoorbeelden werden toegevoegd aan AI-validatie en detectielogica werd toegevoegd aan AI-runtime-bescherming. Op 26 april hebben we met succes misbruik gemaakt van deze aanval tijdens het testen van de modellen van een klant.
De analyse van de sandwichaanval werd later gedeeld in een maandelijkse editie van het Cisco AI Cyber Threat Intelligence Roundup-blog. Voortbouwend op de oorspronkelijke techniek leidde het interne onderzoek van Cisco tot een nieuwe iteratie die bekend staat als een aangepaste sandwich-aanval, waardoor we deze konden aanpassen aan aangepaste gebruiksscenario’s, deze konden combineren met andere technieken en de dekking van het product verder konden uitbreiden.
Een uitgebreid document waarin ons dynamische AI-beschermingskader wordt beschreven, is nu beschikbaar op arXiv. U kunt meer leren over Cisco AI Defense en onze AI-bedreigingsdetectiemogelijkheden in actie zien door onze productpagina te bezoeken en tijd in te plannen met een expert van ons team.








