Zum Inhalt

47-Tage-Zertifikate sind in Planung. Bist du bereit?

Jetzt handeln →

Big Data – Datenverschlüsselung in Big Data

Big Data – Datenverschlüsselung in Big Data

Die Sicherheitsherausforderungen von Big Data

Big Data ist ein aufstrebender Technologiebereich, der es Unternehmen ermöglicht, ihre riesigen Datenmengen besser zu analysieren und so fundiertere Geschäftsentscheidungen zu treffen und die Kundenzufriedenheit zu steigern. Die Datenaggregation in Big-Data-Systemen macht diese jedoch auch zu einem attraktiven Ziel für Hacker. Unternehmen müssen diese Daten effizient verwalten und sensible Kundendaten schützen, um Datenschutzgesetze und Compliance-Anforderungen zu erfüllen. Die Sicherung von Big Data ist aus verschiedenen Gründen komplex.

Einige sind unten erwähnt:

  1. Es gibt mehrere Daten-Feeds in Echtzeit aus verschiedenen Quellen mit unterschiedlichem Schutzbedarf.
  2. Es werden verschiedene Datentypen kombiniert.
  3. Auf die Daten greifen viele verschiedene Benutzer mit unterschiedlichen Analyseanforderungen zu.
  4. Sich rasant weiterentwickelnde Werkzeuge, finanziert durch die Open-Source-Community.
  5. Automatische Replikation von Daten über mehrere Knoten hinweg.

Maßgeschneiderte Verschlüsselungsdienste

Wir bewerten, entwickeln Strategien und implementieren Verschlüsselungsstrategien und -lösungen.

Möglichkeiten zum Schutz von Daten in einer Hadoop-Umgebung

Es gibt mehrere Möglichkeiten, Daten in einer Hadoop-Umgebung zu schützen:

  • Verschlüsselung auf Dateisystemebene: Dieser Verschlüsselung Diese Art der Verschlüsselung wird häufig zum Schutz sensibler Informationen in Dateien und Ordnern verwendet. Sie wird auch als „Datenverschlüsselung im Ruhezustand“ bezeichnet. Die Daten werden auf Dateiebene verschlüsselt und im Ruhezustand, also auf den Datenspeichern, geschützt. Dieser Ansatz schützt die Daten jedoch nicht, wenn sie innerhalb des Systems ausgeführt werden. Die Daten werden automatisch entschlüsselt, sobald sie vom Betriebssystem gelesen werden, und sind somit für jeden autorisierten oder unautorisierten Benutzer oder Prozess, der auf das System zugreift, vollständig zugänglich.
  • Datenbankverschlüsselung: Dateisystemverschlüsselung kann auch zum Schutz von in einer Datenbank gespeicherten Daten eingesetzt werden. Es gibt verschiedene Verfahren zur Datenbankverschlüsselung, darunter die transparente Datenverschlüsselung (TDE) und die Spaltenverschlüsselung. TDE verschlüsselt die gesamte Datenbank. Die Spaltenverschlüsselung ermöglicht die Verschlüsselung einzelner Spalten in einer Datenbank.
  • Transportverschlüsselung: Diese Verschlüsselung dient zum Schutz übertragener Daten durch SSL / TLS Protokolle.
  • Verschlüsselung auf Anwendungsebene: Diese Verschlüsselung nutzt APIs, um Daten auf Anwendungsebene zu schützen.
  • Formatbewahrende Verschlüsselung: FPE Die Daten werden verschlüsselt, ohne das ursprüngliche Datenformat zu verändern. Dadurch können Anwendungen und Datenbanken die Daten nutzen. Der Datenschutz erfolgt auf Feldebene, wodurch sensible Datenbestandteile geschützt und unkritische Daten für Anwendungen freigegeben werden. Da große Datenmengen aus verschiedenen Quellen wie Maschinensensoren, Serverprotokollen und Anwendungsabläufen in den Hadoop Data Lake einfließen, dient dieser als zentrales Repository für eine breite und vielfältige Datenbasis. Der Data Lake muss umfassend geschützt werden, da er wichtige und oft hochsensible Geschäftsdaten speichert. Daten können in Hadoop in mehreren Phasen geschützt werden (vor, während und nach dem Eintritt in den Data Lake).
    • Anwendung zum Datenschutz an der Quelle: In diesem Szenario werden die Daten vor dem Import in Hadoop verschlüsselt. Dies ist die optimale Vorgehensweise. Dadurch wird sichergestellt, dass die Daten während ihres gesamten Lebenszyklus geschützt sind und Hadoop nicht unter Compliance-Bestimmungen fällt. Diese Option erfordert eine Schnittstelle zu den Quellanwendungen für die Verschlüsselung. TokenisierungDie geschützten Daten werden dann in Hadoop importiert.
    • Datenschutz beim Import in Hadoop: Diese Option benötigt keinen Zugriff auf die Quellanwendungen. Die Daten werden hier in der Landing Zone geschützt, sobald sie in Hadoop gelangen.
    • Datenschutz innerhalb von Hadoop: Diese Option schützt Datenfelder, sobald sie in Hadoop identifiziert wurden. Sie nutzt Schnittstellen, die innerhalb von Hadoop-Jobs ausgeführt werden. Es wird Integrationen mit verschiedenen Hadoop-Modulen geben, wie z. B. Hive, Impala, Sqoop, Spark, Storm, Kafka, NiFi usw.
    • Speicherebenenverschlüsselung innerhalb von Hadoop: Die Speicherebene Verschlüsselung Schützt Daten nach physischem Diebstahl oder versehentlichem Verlust eines Datenträgers. Diese Option nutzt TDE innerhalb des Hadoop Distributed File System (HDFS), um eine sichere Landing Zone zu erstellen. Diese Option verlangsamt das System. Für eine höhere Sicherheit sollten Schlüssel auf einem Server verwaltet werden. Hardware-Sicherheitsmodule bei Verwendung von TDE.
Datenverschlüsselung in Big Data