City Traffic methode

De methode van City Traffic om gegevens te anonimiseren blijft me toch bezig houden. Hoe ze precies van een MAC adres hun eigen hash maken die opgeslagen wordt in de database is me ondanks vele vragen nog steeds niet duidelijk. Om toch iets te kunnen doen doe ik hieronder wat aannames, als het ander is hoor ik graag van de specialisten hoe het dan wel moet ( of beter laat het zien in deze github code). Wat ik van ze begrijp doen ze het volgende :

  • Pseudo anonimiseren door hashen het MAC adres naar ‘op sha256 gebaseerde eigen methode’. Normaal geeft een sha256() een hex string van 64 tekens, dus ga ik hier van uit.
  • Nogmaals iets met de hash doen wat een resultaat geeft van 17 tekens. Ondanks meerdere malen te hebben gevraagd hoe/wat ze het terug brengen naar 17 teken heb ik geen idee wat ze precies doen. Voor nu ga ik van uit dat ze van de 64 tekens de eerst 17 tekens gebruiken.

Als ik van de hierboven gestelde methode uitga en ik ga voor 17.000.000 ‘adressen’ (ALLE inwoners van Nederland) de eerste 17 tekens van sha256 opslaan in een database, hoeveel dubbele hashes denk je dat ik dan heb? Ik heb het programma gemaakt die precies dit doet, het antwoord is dat ik 0 (!!) dubbele hashes heb. Dus als we deze methode vertalen naar de ‘City Trafic’ methode betekent dit dat het ‘dubbel hashen’ van getallen leuk is maar nog steeds 1 persoon is, en dus een persoonlijk gegeven. Als ik uitga van een stad van Enschede met 5000 bezoekers moet je het aantal karakters terugbrengen naar 4 of minder om een beetje te anonimiseren , (met 4 tekens 184 dubbele records (nog steeds te weinig naar mijn mening), met 5 krijgt men 8 dubbele records, met 6 is iedere record uniek).

Toby Kuiper heeft ook wat meer inhoudelijk naar deze getallen gekeken en komt tot de conclusie dat kans op een dubbel hash wel heel erg klein is (gelijk aan 1500000 x achter elkaar de staatsloterij winnen).

MOA en mijn site telmeniet.nl

Van de week heb ik een leuk gesprek gehad met de MOA (belangen vereniging marketing bureau) over mijn site ‘telmeniet.nl‘. In een per email gestuurde brief geven ze aan dat ik deze site heb geregistreerd na die van hun (klopt maar wat dan nog?) en dat deze site inbreuk zou maken op hun merk. In de eerste regel van mijn site geef ik aan dat het niet het officiële register is maar uitleg waarom dit naar mijn mening een slecht idee zou zijn. Ik doe me niet voor als MOA of het echte register, dus ik heb geen idee waar deze verwarring dan vandaan zou kunnen komen. De MOA directeur beschuldigde me van ‘fake nieuws’ en eiste min of meer dat ik mijn site aanpast naar mening van MOA (en Citty Trafic) dat ze niet aan wifi tracking doen maar wifi telling. Bovendien stelde hij dat onderzoek vrijgesteld was aan toestemming vooraf vragen (later per email gevraagd in welke wet dit dan precies staat, maar hier heb ik nog geen antwoord op gekregen). Wel even bij een onderzoeker op UT nagevraagd of zoiets bestaat, deze gaf aan dat de regels voor onderzoek eerder veel strikter is ipv vrijgesteld van privacy regels. Als het vrijgesteld zou zijn waarom heeft MOA dan een site voor het uitschrijven voor onderzoeken ?

Als je de site zelf bekijkt zijn er wel wat opmerkingen te maken :

  • Indien je inschrijft en je verstuurd de aanvraag krijg je een php foutmelding. Je weet dan niet of het wel/niet gelukt is (je krijgt dan wel een email om je inschrijving te bevestigen. Deze fout zit er al minstens 2 maanden in, dus is niet een tijdelijke fout.
  • Je bent verplicht je email (en telefoonnummer ?) achter te laten, ook als je geen herinneringen wilt ontvangen en dus email niet nodig is.
  • Zoals een deelnemer van TkkLab aangaf er wordt nergens aangegeven wat en hoe het wordt opgeslagen. Indien men het MAC adres zelf opslaat ontstaan hierdoor weer privacy risico’s (helemaal met combinatie van je email adres & telefoonnummer). Men zou dit kunnen voorkomen door het MAC adres te hashen, of zoals City Traffic het noemd “pseudo anonimiseren”.

Ik vraag me dus echt af of ze zelf wel naar de site hebben gekeken en of ze getest hebben of het werkt. Als je in de basis functionaliteit al dit soort fouten maakt kun je vraagtekens zetten bij de (kwaliteit) van de rest van de site.

Het zou heel vervelend voor de MOA zijn als mijn site hoger in de zoekresultaten van google staat als hun eigen site. Om dit te voorkomen wil ik je vragen om niet een link op je site/blog/etc te plaatsen naar telmeniet.nl

Toestemming gebruik biologisch restmateriaal

Van de week was ik bij het ziekenhuis in Enschede om bloed te laten afnemen. In de wachtkamer hing een tv scherm met een melding over privacy en eventuele mogelijkheid om bezwaar maken voor het gebruik van ‘restmateriaal’.

Normaal blijft er na onderzoek biologisch materiaal over, dit materiaal kan (geanonimiseerd) gebruikt kunnen worden voor wetenschappelijk onderzoek. Volgens het bedrijf Medlon (commercieel bedrijf die bloedonderzoeken voor het ziekenhuis uitvoert) is dit volgens de wet toegestaan. Je kunt via een folder wel hiertegen bezwaar maken, dan word je restmateriaal na onderzoek meteen vernietigd en niet gebruikt voor wetenschappelijk onderzoek.

De wetten die hiervoor van toepassing zijn Burgerlijk Wetboek 7, artikel 458 en 467. Voor de volledigheid citeer ik deze wetten hieronder (tekst in bold door mij toegevoegd) :

Artikel 458

  • 1) In afwijking van het bepaalde in artikel 457 lid 1 kunnen zonder toestemming van de patiënt ten behoeve van statistiek of wetenschappelijk onderzoek op het gebied van de volksgezondheid aan een ander desgevraagd inlichtingen over de patiënt of inzage in de bescheiden, bedoeld in artikel 454, worden verstrekt indien:
    • a.het vragen van toestemming in redelijkheid niet mogelijk is en met betrekking tot de uitvoering van het onderzoek is voorzien in zodanige waarborgen, dat de persoonlijke levenssfeer van de patiënt niet onevenredig wordt geschaad, of
    • b.het vragen van toestemming, gelet op de aard en het doel van het onderzoek, in redelijkheid niet kan worden verlangd en de hulpverlener zorg heeft gedragen dat de gegevens in zodanige vorm worden verstrekt dat herleiding tot individuele natuurlijke personen redelijkerwijs wordt voorkomen.
  • 2) Verstrekking overeenkomstig lid 1 is slechts mogelijk indien:
    • a.het onderzoek een algemeen belang dient,
    • b.het onderzoek niet zonder de desbetreffende gegevens kan worden uitgevoerd, en
    • c.voor zover de betrokken patiënt tegen een verstrekking niet uitdrukkelijk bezwaar heeft gemaakt.
  • 3) Bij een verstrekking overeenkomstig lid 1 wordt daarvan aantekening gehouden in het dossier.

Artikel 467

  • 1) Van het lichaam afgescheiden anonieme stoffen en delen kunnen worden gebruikt voor medisch statistisch of ander medisch wetenschappelijk onderzoek voor zover de patiënt van wie het lichaamsmateriaal afkomstig is, geen bezwaar heeft gemaakt tegen zodanig onderzoek en het onderzoek met de vereiste zorgvuldigheid wordt verricht.
  • 2) Onder onderzoek met van het lichaam afgescheiden anonieme stoffen en delen wordt verstaan onderzoek waarbij is gewaarborgd dat het bij het onderzoek te gebruiken lichaamsmateriaal en de daaruit te verkrijgen gegevens niet tot de persoon herleidbaar zijn.

Ik ben geen jurist maar hieruit lees ik :

  • Artikel 467.1 “…geen bezwaar heeft gemaakt…” – dit is naar mijn mening de essentie waar het om draait, hoe weet je dat er geen bezwaar is. In mijn mening weet je dit alleen als je expliciet er om gevraagd wordt. Aannemen dat er geen bezwaar is tenzij je dit aangeeft lijk met de omgekeerde van wat wenselijk is.
  • Artikel 485.1.a “….toestemming in redelijkheid niet mogelijk….” bij een bloedonderzoek is het altijd wel mogelijk om toestemming te vragen, er is hier geen sprake van levensbedreigenden of spoed situatie. Wellicht dat hiervoor bestaande procedures moeten aangepast maar dat is dan niet een reden om dit te doen.

Samenvattend lijkt me dat je aan persoon / patiënt VOORAF toestemming zou moeten vragen om op restmateriaal wetenschappelijk onderzoek te doen. Nu wordt er van uitgegaan dat je geen bezwaar hebt tenzij je dit aangeeft, dus zeg maar de je opt-out moet doen terwijl je opt-in zou verwachten.

Persoonlijk vind ik het ook niet een prettig idee dat een commercieel bedrijf met je bloed (en eventuele ander biologisch materiaal) aan de haal kan gaan zonder dat vooraf helemaal duidelijk is wat er exact mee gebeurt. Dat het geanonimiseerd gebeurt is goed, maar er zijn genoeg onderzoeken bekend waarbij geanonimiseerd data toch weer naar individuen gekoppeld kan worden. Wellicht ben ik een doemdenker op dit vlak maar het zou zo kunnen zijn dat bv een zorg verzekerings bedrijf getipt wordt over iets waardoor je meer premie moet betalen of zelfs verzekering geweigerd word.

Ik ben geen jurist maar wie kan me aangeven of ik de wet zo goed interpreteer (of dat er inderdaad ruimte hiervoor is)?

Wat vind jij, kan restmateriaal standaard geanonimiseerd gebruikt worden door een commercieel bedrijf voor wetenschappelijk onderzoek?

Wifi Tracking in Hengelo

In Hengelo is men in april 2019 helaas ook gestart met wifi tracking, maar gelukkig is daar Groen Links die daar vragen over stelt. In antwoord van een van de vragen wordt door RCM / City Traffic aangegeven dat men in de hash geen hash collisions wil hebben, wat je als je de privacy wil beschermen juist wel zou willen hebben. Uit de brief

Bij pseudonimiseren kan hashing collision plaats vinden. Bureau RMC hasht op basis van SHA-256 (Secure Hash Algorithm 2). RMC gebruikt geen SHA-1, de reden hiervoor is dat ze hashing collision willen voorkomen. De statistische kans dat dit nu nog plaatsvindt is 1⁄2 tot de macht 62.

In ieder geval goed om te zien dat ook in Hengelo kritische vragen gesteld worden en ik heb gisteren kennis gemaakt met de ‘bezorgde burger’ die de raadsleden hierin assisteert.

Landelijk Wifi opt-out register

Op 2 Maart meld nu.nl dat de Wifi tracking bureau’s gebruik willen gaan maken van een landelijk opt-out register.

Dit lijkt een goede stap maar hierbij wordt volledig voorbij gegaan aan de oorspronkelijk probleem. Je moet volgens de AVG VOORAF toestemming vragen of je prive gegevens (zoals je MAC adres) wil delen met derden. Pas NA deze toestemming zou iemand getrackt mogen worden in de stad. In de praktijk is hiervoor geen techniek om dit voor wifi tracking mogelijk te maken, maar dat betekent niet dat je dan maar zonder deze toestemming mensen moet gaan tracken.

Een ander zwaarwegend punt is dat mensen zich onbespied moeten kunnen rondbewegen, met wifi tracking is die niet het geval. Dit is dan een zware inbreuk op je privacy waar niet te licht overheen gestapt moet worden.

Mijn bezwaren tegen opt-out register

Met een opt-out register moet de consument actie ondernemen als hij niet gevolgd wil worden in de stad. Al klinkt het ‘privacy vriendelijk’ hiermee komt de verantwoordelijkheid bij de consument te liggen in plaats van de wifi tracking bureau. Dit is het omkeren van de huidige wettelijke regels. In gesprekken die ik met CityTraffic heb gehad weet ik ook dat erg weinig mensen gebruik van maken van deze mogelijkheid (denk aan tientallen voor een stad zoals Enschede). Je moet namelijk je MAC adres op je telefoon opzoeken en deze ingeven in een site, dit is voor veel mensen toch wel een lastige opgave.

Naar mijn mening proberen de wifi bureau’s op deze manier hun illegale werkwijze te legaliseren. Ook met de opmerking dat gegevens nu geanonimiseerd zijn ben ik nog aan het onderzoeken, hiermee heb ik wel contact met Citytraffic maar de exacte technische details boven water krijgen gaat nog moeizaam. Op dit moment heb ik nog sterk de indruk dat dit vooral marketing praat is, niet iets wat cijfermatig of door wetenschappelijk onderzoek onderbouwd is.

Wil je meer over wifi tracking weten lees dan dossier wifi tracking

Uitleg nieuwe methode CityTraffic

Edit 9-1-2019 : Inmiddels met CityTraffic gesproken en er gebeurd wat meer dan 2x hashen. Er worden ook gegevens getruncate, dit zou dan voor voldoende privacy moeten zorgen. Hiermee kunnen ze niet meer de tijdsduur in de stad of zien of iemand nieuw is zien.  Ik probeer nog meer technische details te achterhalen en zal het hier aanvullen.

CityTraffic geeft aan dat zij van een pseudo geanonimiseerde data naar geanonimiseerd data. Als ik de informatie goed begrijp doen ze dit door een extra hash of versleuteling uit te voeren op de gegevens die van de sensor binnen komen en in de database gezet wordt.

Anonimiseren van data heeft een lange geschiedenis en blijkt in de praktijk ook tegen te vallen om dit goed te doen. Er zijn vele gevallen bekend dat een anonieme dataset is vrijgegeven waarbij de onderzoekers er toch in slaagden om deze te koppelen met personen. In het kort zou het voor wifi telling alleen kunnen als je op het sensor al genoeg gegevens cummeleerd (waardoor meteen individuele gegevens verdwijnt). In het huidige verhaal van CityTraffic wordt eerst alle gegevens van de sensor doorgestuurd naar de database, dus 1 regel in de database is nog steeds 1 persoon. Dat daar een dubbel hash / versleuteld nummertje bijstaat die niet terug te voeren naar een MAC adres maakt niet uit, dit is niet wezenlijk anders dan in de oude situatie waarbij MAC adres dmv hash SHA265 wordt berekend.

In mijn optiek heeft CityTraffic de methode niet voldoende aangepast om echt te kunnen spreken van anonieme gegevens. Ze versleutelen de MAC adres 2x, een keer op de sensor en vervolgens op de server. Maar als de gegevens van 1 persoon nog steeds individueel in de database komt maakt dit allemaal niet uit, hoe vaak je ook het MAC adres hash / versleuteld.

 

 

Herstart wifitracking Enschede 1 Jan 2019

Vandaag heeft de gemeenteraad Enschede een brief ontvangen waarin wordt aangegeven dat men in Enschede per 1 januari 2019 weer herstart met wifi telling. Volgens City Trafic zijn de problemen met AP opgelost door over te gaan van pseudonimiseren naar anonimiseren. Helaas wordt niet toegelicht hoe ze dit precies gaan doen, ik ga hier nog wel achteraan om te vragen naar (technische) uitleg.

Hierbij wordt nog steeds aan andere punten van de AVG voorbijgegaan, namelijk dat je VOORAF toestemming moet vragen. Tevens geeft AP in brief van 30 November aan dat wifitracking alleen in uitzonderlijke situaties mag, het lijkt er op dat City Traffic / Gemeente Enschede ook deze regel naast zich legt en doorgaat met 24/7 volgen van hun burgers.

Zelf vraag ik me af waarom een Europese partij (Locatus) naar aanleiding van de brief 30 November wel stopt en waarom City Trafic dan niet stopt. Mij lijkt me dat Locatus hetzelfde zou kunnen doen, of ze hebben daar de conclusie getrokken dat dit niet mogelijk is.

Enschede stopt voorlopig met wifi tracking

Op 30 November heeft AP een persbericht gestuurd waarin kort samengevat wordt aangegeven dat wifi tracking alleen is toegestaan in uitzonderlijke omstandigheden. Hierbij kun je denken aan drukke evenementen waarbij het ivm veiligheid van belang is om de drukte in de gaten te houden. Belangrijk hierbij is dan dat dit voor een korte periode gaat en beperkt gebied.

Naar aanleiding van dit persbericht zijn diverse gemeenten gaan nadenken over hun wifi tracking in de binnenstad. Gemeente Leeuwarden had afgelopen donderdag al aangegeven om te stoppen met wifi tracking. Vandaag bereikte me het goede nieuws dat Gemeente Enschede in een brief aan de gemeenteraad aangeven (voorlopig) ook te stoppen met wifi tracking. Op dit moment wil gemeente Enschede verder kijken wat de consequenties is van het persbericht van AP, natuurlijk hoop ik dat ze tot inzicht komen dat wifi tracking een te grote inbreuk is op de privacy van de burgers.

Mijn handhavingsverzoek die ik aan de AP had gestuurd is nog in behandeling, nav het persbericht had ik gevraagd of dit persbericht door mijn handhavingsverzoek kwam en of er nog nieuws was over de situatie in Enschede. Hier konden ze me geen extra informatie over verschaffen, dus moet ik nog wachten tot een officieel antwoord. AP had al eerder aangegeven dat ze meer tijd nodig hadden, het officiële antwoord zou ik voor 19 Januari moeten ontvangen.

Zie ook dit persbericht in Tubantia

Brief gemeente aan raadsleden op site gemeente

Makerspace TwenSpace

makerspace enschede twenspace

Enschede is een makerspace rijker, namelijk TwenSpace. Deze door mij opgerichte makerspace zou ik uiteindelijk professioneel diverse apparatuur willen aanbieden zoals lasercutter, 3d printer en ook een hout- en metaalwerkplaats.

lasercutter TwenSpace

De eerste tool heb ik al aangeschaft, een 60x90cm 100W laser cutter. Deze staat voor nu nog bij TkkrLab, zolang ik nog geen eigen plek heb zal ik vanuit hier mijn activiteiten uitvoeren. Er staat voor 19 september ook een workshop “introductie 3d printen” op de planning als voorproefje van de TkkrLab 3d printer bouwweekend.

Mocht je op de hoogte willen blijven van mijn activiteiten bij TwenSpace volg me via Twitter, Facebook of via de nieuwsbrief.

Hopelijk tot binnenkort bij TwenSpace !