Mit maschinellem Lernen gegen Spam und andere Bedrohungen

Originalartikel von Jon Oliver

Der Anfang von Spam lässt sich auf 1978 datieren, als ca. 400 ARPANET (Advanced Research Projects Agency Network)-Nutzer eine Mail mit der Einladung zu einer Produktpräsentation von einem Marketier von Digital Equipment Corporation (DEC) erhielten. Einige Jahre später wurden Mails, die als Massenaussendung Produkte oder Dienste anpriesen, als Spam bezeichnet. Cyberkriminelle machten sich Spam schon lange zunutze. 2002 erreichte das Spam-Volumen 2,4 Mrd. pro Tag und heutzutage sind es mehr als 300 Milliarden, viele davon zu Phishing- oder weiteren böswilligen Zwecken.

Als Gegenmaßnahmen erstellten Antispam-Hersteller Lösungen, die eine Kombination aus Hashes und Spam-Signaturen nutzten, die manuell zusammengestellte Regeln umfassten. Das Ergebnis war zweispältig: Zum einen konnte damit etwa 50 Prozent der Spam-Mails geblockt werden, aber zum anderen gab es die Erkenntnis, dass der Ansatz bei dem riesigen Spam-Aufkommen nicht sehr effizient sei.

Antispam-Lösungen mussten damit fertig werden, noch bevor die Mails ins Netzwerk kamen, denn es war zu riskant und auch nicht praktisch, die Auslieferung von potenziell bösartigen Mails zu erlauben und erst danach zu reagieren.

Der Bedarf, effizientere Möglichkeiten für den Schutz vor Spam zu finden, ließ die Antispam-Anbieter auf Machine Learning (ML) zurückgreifen, ein Tool, dass Riesenmengen an Informationen oder Trainingsdaten analysiert, um einzigartige Muster zu erkennen. Das Ergebnis: Die allgemeine Cyberverteidigung wurde so verbessert, dass die Lösungen etwa 95 Prozent [1] des Spams erkennen. Damit wurde ML zur Schlüsseltechnologie für das Blocken von Junk-Mails.


Machine Learning in Kombination mit weiteren Antispam-Techniken kann 95% des Spams abfangen

Trend Micro begann 2005 via Trend Micro Anti-Spam Engine (TMASE) and Hosted Email Security (HES) Machine Learning einzusetzen, um Spam zu erkennen und zu blocken. Die Technik wird gemeinsam mit weiteren Antispam-Schutzschichten (z.B. Email Reputation Services, IP Profiler, Antispam Composite Engine) eingesetzt. Die Algorithmen werden zur Korreierung von Bedrohungsinformationen genutzt und für die Durchführung von tiefgehenden Datenanalysen, um Spam zu finden und aus den Unternehmensnetzwerken herauszuhalten. Mittlerweile ist ML zu einem integralen Bestandteil einer Sicherheitslösung für das Aufspüren von Bedrohungen geworden, weil die Technik in der Lage ist, die Bösartigkeit einer unbekannten Datei, die in ein System kommt, vorherzusagen. Doch die Erfolgsrate eines ML-Modells hängt nicht nur von der Menge der verfügbaren Daten ab, sondern auch von Qualität und Genauigkeit der Kennzeichnung der Daten, sowie vom Einsatz modernster Modelle und dem Vertrauen in eine iterative Methode zur Verbesserung der Genauigkeit des Modells. Weitere Details finden Sie im Originalbeitrag.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

*

This site uses Akismet to reduce spam. Learn how your comment data is processed.