De beveiligingsuitdagingen van big data
Big Data is een opkomende reeks technologieën die organisaties in staat stelt meer inzicht te krijgen in hun enorme hoeveelheid data, wat leidt tot betere zakelijke beslissingen en een hogere klanttevredenheid. De aggregatie van data in bigdatasystemen maakt ze ook een aantrekkelijk doelwit voor hackers. Organisaties moeten deze data efficiënt kunnen verwerken en gevoelige klantgegevens beschermen om te voldoen aan een reeks privacywetten en compliance-eisen. Het beveiligen van big data is om meerdere redenen lastig.
Enkele daarvan worden hieronder genoemd:
- Er zijn meerdere feeds met gegevens in realtime uit verschillende bronnen met verschillende beveiligingsbehoeften.
- Er worden meerdere soorten gegevens gecombineerd.
- De gegevens worden geraadpleegd door veel verschillende gebruikers met uiteenlopende analytische vereisten.
- Snel evoluerende tools, gefinancierd door de open source community.
- Automatische replicatie van gegevens over meerdere knooppunten.
Manieren om gegevens in een Hadoop-omgeving te beschermen
Er zijn verschillende manieren om gegevens in een Hadoop-omgeving te beschermen:
- Versleuteling op bestandssysteemniveau: In deze encryptie Wordt vaak gebruikt om gevoelige informatie in bestanden en mappen te beschermen. Dit type encryptie staat ook bekend als "data-at-rest"-encryptie. Gegevens worden op bestandsniveau versleuteld en beschermd in rust, terwijl ze zich in een datastore bevinden. Deze aanpak beschermt de gegevens echter niet wanneer ze binnen het systeem worden uitgevoerd. De gegevens worden automatisch ontsleuteld wanneer ze door het besturingssysteem worden gelezen, en deze gegevens zijn volledig blootgesteld aan elke geautoriseerde of ongeautoriseerde gebruiker of proces dat toegang heeft tot het systeem.
- Database-encryptie: Versleuteling op bestandssysteemniveau kan ook worden gebruikt om gegevens in een database te beschermen. Er zijn verschillende technieken beschikbaar voor databaseversleuteling, waaronder Transparent Data Encryption (TDE) en versleuteling op kolomniveau. TDE wordt gebruikt om een volledige database te versleutelen. Versleuteling op kolomniveau maakt het mogelijk om afzonderlijke kolommen in een database te versleutelen.
- Transportniveau-encryptie: Deze encryptie wordt gebruikt om gegevens tijdens de overdracht te beschermen SSL / TLS protocols.
- Versleuteling op applicatieniveau: Deze encryptie maakt gebruik van API's om gegevens op applicatieniveau te beschermen.
- Opmaakbehoudende encryptie: FPE Versleutelt de gegevens zonder het oorspronkelijke gegevensformaat te wijzigen. Dit stelt applicaties en databases in staat de gegevens te gebruiken. Gegevensbescherming wordt toegepast op veldniveau, waardoor de gevoelige delen van de gegevens worden beschermd en de niet-gevoelige delen aan applicaties worden overgelaten. Omdat een grote hoeveelheid gegevens uit meerdere bronnen, zoals machinesensoren, serverlogs en applicatiestromen, in het Hadoop Data Lake wordt opgenomen, dient het als een centrale opslagplaats voor een brede en diverse dataset. Het data lake moet worden beveiligd met uitgebreide beveiliging, omdat het essentiële en vaak zeer gevoelige bedrijfsgegevens zal opslaan. Gegevens kunnen in meerdere fasen in Hadoop worden beschermd (vóór, tijdens of na de invoer):
- Gegevensbescherming bij de brontoepassing: In dit scenario worden de gegevens versleuteld voordat ze in Hadoop worden geïmporteerd. Dit is het ideale scenario. Dit zorgt ervoor dat de gegevens gedurende de gehele levenscyclus van de gegevens beschermd zijn en Hadoop niet binnen het bereik van compliance-doeleinden valt. Deze optie vereist een interface naar de bronapplicaties voor versleuteling en tokenizationDe beveiligde gegevens worden vervolgens geïmporteerd in Hadoop.
- Gegevensbescherming tijdens het importeren in Hadoop: Voor deze optie is geen toegang tot de bronapplicaties nodig. De gegevens worden in de landingszone beschermd wanneer ze Hadoop binnenkomen.
- Gegevensbescherming binnen Hadoop: Deze optie beschermt gegevensvelden zodra ze in Hadoop zijn geïdentificeerd. Deze optie maakt gebruik van interfaces die binnen Hadoop-jobs draaien. Er zijn integraties met verschillende modules in Hadoop, zoals Hive, Impala, Sqoop, Spark, Storm, Kafka, NiFi, enz.
- Versleuteling op opslagniveau binnen Hadoop: Het opslagniveau encryptie Beschermt gegevens na fysieke diefstal of onbedoeld verlies van een schijfvolume. Deze optie maakt gebruik van TDE binnen Hadoop Distributed File System (HDFS) om een veilige landingszone te creëren. Deze optie vertraagt het systeem. Voor betere beveiliging moeten sleutels worden beheerd op Hardwarebeveiligingsmodules bij gebruik van TDE.

