Home – Data Privacy Guard – Anonimiseermethoden

Hoe wilt u uw gegevens anonimiseren?

Data Privacy Guard biedt een brede set anonimiseermethoden en algoritmen. Bekijk in onderstaande tabbladen wat de mogelijkheden zijn voor uw dataset.

De optie Replace vervangt alle rijwaarden van de betreffende kolom in een vooraf gedefinieerde waarde. Deze methode is een voorbeeld van een generalisatietechniek waarmee identificatie op basis van persoonsgegevens onmogelijk wordt.

  • Alle waarden aan elkaar gelijk

    Door het gebruik van Replace zorgt u ervoor dat unieke waarden verdwijnen en vervangen worden door een standaardwaarde.

  • Markeer velden als geanonimiseerd

    Bijvoorbeeld: vervang de inhoud van een memo kolom door “Geanonimiseerd”, zodat direct duidelijk is dat alle persoonsgegevens verwijderd zijn.

De Remove-methode verwijdert alle waarden in de betreffende kolom. Dit is de meest simpele methode die toegepast kan worden op kolommen die niet gebruikt worden in de processen na het anonimiseren.

  • Dataminimalisatie

    Het verwijderen van alle waarden in een kolom past de structuur van uw tabel niet aan, terwijl privacygevoelige data wel verdwenen is.

De Randomize-methode vervangt iedere waarde door een andere willekeurig geselecteerde waarde binnen de betreffende kolom. Iedere keer dat het anonimiseerproces wordt uitgevoerd resulteert dit in onvoorspelbare en andere waarden.

  • Houd uw datadistributie intact

    Een additionele optie is het intact houden van uw datadistributie. Bijvoorbeeld door te zorgen dat een bepaalde naam of stad na het anonimiseren net zo vaak in de dataset voorkomt als voor het anonimiseren.

  • Forceer een niet-identieke waarde

    Een andere additionele optie is het afdwingen dat een rijwaarde na anonimiseren nooit gelijk is aan de waarde voor het anonimiseren.

Randomize Collection is een uitbreiding op de Randomize-methode. Het algoritme wordt niet op een enkele kolom toegepast, maar op een collectie van twee of drie kolommen. De rijwaarden van deze kolommen blijven tijdens het anonimiseerproces bij elkaar, waardoor de relatie tussen de kolommen per rij gewaarborgd blijft.

  • Afhankelijke waarden intact

    Deze methode kan bijvoorbeeld worden toegepast om geografische gegevens bij elkaar te houden, zoals een postcode bij een bepaalde woonplaats.

Met Randomize Pool worden alle waarden binnen een kolom vervangen door een willekeurige waarde uit een set die door u is gespecificeerd. Dit is handig wanneer bijvoorbeeld slechts specifieke waarden bruikbaar zijn in uw testproces.

  • Geen beperkingen set van waarden

    Er is geen beperking aan de omvang van de set waarden waaruit het anonimiseerproces kan kiezen. Het is zelfs mogelijk de waarden vanuit een externe bron aan te leveren.

Randomize Interval vervangt de numerieke of datumwaarden in een kolom met een nieuwe waarde op basis van een interval die u definieert. Bijvoorbeeld, als u Randomize Interval instelt op een datumkolom dan kan u een interval instellen van 10 dagen. Wanneer de gegevens geanonimiseerd worden, dan worden de data in de kolom vervangen door een willekeurige datum tussen de -10 en +10 dagen van de oorspronkelijke datum.

  • Data en numerieke getallen

    Deze methode kan ingesteld worden op numerieke- en datumkolommen.

  • Meerdere intervallen mogelijk

    Datumintervallen kunnen ingesteld worden op een schaal van dagen, weken, maanden en jaren.

Tokenize is een pseudonimiseeralgoritme dat elke unieke rijwaarde vervangt door een willekeurig gegenereerde sleutelwaarde. Door deze methode toe te passen kunt u relaties tussen verschillende datasets in stand houden. Ook kunt u, bijvoorbeeld wanneer uw onderzoek hierom vraagt, de waarde behorende bij een rij in uw originele dataset achterhalen.

  • Houd relaties tussen datasets intact

    Tokenize is bijzonder handig wanneer u na het anonimiseren datasets met elkaar wilt verbinden, bijvoorbeeld op basis van een sleutelveld zoals Klant ID.

  • Herleid de originele waarde

    Soms wilt u, bijvoorbeeld voor onderzoeksdoeleinden, de waarde behorende bij een rij in de originele dataset kunnen herleiden. De Tokenize-methode maakt dit mogelijk.

  • Configureerbaar tokenformaat

    Door het tokenformaat te configureren zorgt u dat de sleutelwaarde altijd in uw datamodel past.

Met de Hash-methode kan u alle waarden binnen een kolom veranderen in een willekeurige combinatie van letters en cijfers.

  • Volledig willekeurige hash

    De nieuwe waarde is niet gebaseerd op de originele waarde, maar is een volledig willekeurig gekozen nieuwe waarde.

De Truncate-methode verwijdert de volledige inhoud van een tabel. Deze methode is alleen toepasbaar als u een tabel in een database anonimiseert.

  • Snel legen van audit- en logtabellen

    Deze methode wordt vaak gebruikt om snel log- en audittabellen te legen als deze gegevens geen rol spelen in de processen na het anonimiseren.

Additionele opties

Heeft u na de toepassing van bovenstaande methoden nog specifieke anonimiseerwensen? Met de volgende configuratieopties is nog meer mogelijk!

  • Condities

    Met condities kunt u instellen wat precies wel en niet geanonimiseerd moet worden. Zo kunt bij bijvoorbeeld testpersoonsgegevens uitsluiten van het anonimiseerproces.

  • Filter op methode

    Indien u niet de volledige dataset wilt anonimiseren maar slechts een onderdeel met een specifieke methode, dan is dit mogelijk door een methodefilter toe te passen op uw configuratie.

  • Filter op tabel

    Met een tabelfilter kunt u het door u geconfigureerde anonimiseerproces uitvoeren op een specifieke tabel in uw database.