Maakt RDW potje van kentekenregister? Ik denk het niet!

Gisteravond kreeg ik van Ted Sluymer een vraag of de term “Kentekendata” veel gebruikt wordt. Ik ken Ted inmiddels al een tijdje als de drijvende kracht achter Autokiosk.nl (en vele andere mensen kennen  van periodes van andere betrekkingen van hem). Ted benadert vaak op een andere manier de materie. Het geeft altijd voer tot nadenken. De ene keer ben ik het met hem eens en de andere keer niet. In de laatste categorie zie ik Teds nieuwste artikel over RDW kentekenregister. In deze posting mijn andere visie over zijn constateringen. Deze posting kan ik, helaas, niet bij posting op Autokiosk kwijt, want reacties geven zijn dichtgezet. Gelukkig is Ted via andere sociale media goed bereikbaar…

Teds mening

Voor degene die het artikel van Ted hebben gemist. Onder de noemer “RDW houdt kentekendata bij en maakt er een potje van” vertelt Ted door middel van diverse voorbeelden gevonden in RDW Open data dat RDW het niet zo nauw neemt met het juist registreren van het Nederlands wagenpark. Immers als met een paar zoekacties als zoveel “fouten” gevonden kunnen worden, hoeveel fouten zullen dan nog niet gevonden zijn?, aldus Ted.

Mijn mening

Natuurlijk heeft Ted gelijk dat er rariteiten zitten in de dataset van RDW. Dat kan ik niet ontkennen. Ik heb er immers zelf ook over gerapporteerd . Ik ben echter niet eens met de duiding die Ted hieraan geeft. Als reactie op Teds bevindingen heb ik een aantal weerwoorden. Deze wil ik categoriseren onder de volgende noemers:

– RDW beheert zuiverste kentekenregister van Europa, wellicht van de wereld

– Data, informatie en databases

– Doel open data

– Misleiding of begeleiding?

Zuiverste kentekenregister

Nederland was 1 van de eerste landen van de wereld waar een kentekenplaat werd uitgegeven eind negentiende eeuw. Volgens de overlevering zijn ze ooit ontstaan, omdat politiemensen al fietsend de nieuwe gedrochten van de weg niet meer konden bijhouden. Deze platen werden provinciaal uitgegeven (kijkerstip: doorzoeken Groninger kentekens). Na de tweede wereldoorlog was er door de groei van autoverkoop een behoefte aan een landelijk registratiesysteem van kentekens. Al vrij vroeg is daarbij het uitgangspunt gekomen om een uniek kenteken te maken per uniek voertuig. Deze unieke shortcode heeft grote voordelen gehad in de registratie van destijds grote kaartenbakken (aldus de overlevering). Deze kaartenbakken werden later vervangen door computers en databases.

De Nederlandse overheid heeft daarbij al in vrij vroeg stadium de behoefte onderkend om voertuigen gedurende hun hele levenscyclus op de Nederlandse weg te volgen, van 1e registratie tot de laatste registratie (sloop of export). Hiermee heeft procesmatig de uitvoerder van deze beheerstaak, RDW, een compleet beeld van het Nederlands wagenpark gecreerd. Europees gezien is dat redelijk uniek. Voor diehards die hierover meer willen weten, is het rapport Vehicle Chain van Ereg-association een aanrader.

Een ander opvallend feit is dat RDW met haar ketenpartners al jaren geleden mutaties in het register deels heeft uitbesteed aan de voertuigbranche en deze informatie ook deelbaar heeft gemaakt via zogenaamde informatieproviders (waarvan VWE er 1 is). Dit heeft als voordeel dat er meer ogen kijken naar dezelfde data en dat dezelfde data ook meer als standaard wordt gebruikt. In veel landen is het kentekenregister een besloten bolwerk waarbij commerciele partijen het moeten doen met extracten en aggregaties. Deze partijen investeren veel tijd en moeite om iets van een kopie te maken waarmee de autobranche en/of (kopende) consument bediend kan worden.

In mijn rol als manager business development heb ik vaak contacten met buitenlandse partijen die niet alleen kentekengegevens uit Nederland verwerken, maar ook uit andere landen. Keer op keer geven deze partijen aan dat de Nederlandse gegevens qua actualiteit en volledigheid zeer bruikbaar zijn en dat ze telkenmale in andere landen andere bestanden tegenkomen. Ik moet hierbij wel zeggen dat de additionele opschoning en verrijking die VWE toepast op de bestanden hierbij toepast, ook een belangrijke bijdrage speelt, maar daarover later meer…

Data, informatie en databases

In mijn zakelijke rol heb ik veel te maken met diverse databronnen. Vanwege mijn expertise op dat gebied maak ik nieuwe collega’s graag wegwijs in de toepassing van de verschillende databronnen waarover VWE beschikt. Hierbij geef ik altijd aan dat het beseffen waarom de data op een gestructureerde manier wordt bijgehouden door de datahouder al heel veel vertelt over de vulling en kwaliteit van de data. Pas bij dit besef ontstaan de mogelijkheden om van data informatie te maken door onszelf of onze klanten.

RDW verzamelt haar data met als taak haar opgedragen taken goed ten uitvoer te brengen. Vaak ter ondersteuning van andere overheidsdiensten (zoals belastingdienst of politie). Zo zal de boete van CJIB op basis van een foto van het kenteken bij de juiste persoon op de deurmat belanden. Zo zal je echter in kentekenregister nooit gegevens vinden of een auto airconditioning heeft of niet. Dit is namelijk niet relevant voor het doel waarvoor de gegevens oorspronkelijk bedoeld zijn.

Data opslaan één keer opslaan in een bepaald formaat is geen enkele kunst. Data continu opslaan en muteren volgens een bepaalde standaard is al vele malen moeilijker. Data muteren door en met vele handelingen begint al een ware crime te worden vanuit perspectief van kwaliteit. Zeker als het hierbij gaat om miljoenen objecten met hele reeksen aan kolommen, waarbij een groot gedeelte ook nog muteerbaar kunnen zijn in den tijd. In het kort komt het erop dat 100% datakwaliteit niet te garanderen is. Ondanks alle automatische checks die je kan verzinnen, slippen er altijd ogernschijnlijk valide vullingen door de mazen, waardoor de data nooit 100% zuiver zal worden.

Juist de manier waarop deze “fouten” opgepakt en verwerkt worden, geeft een indicatie hoe verantwoordelijk een datahouder met zijn gegevens omgaat.

Doel open data

Open data speelt juist op dit laatste stuk in. 1 van de gestelde doelen van veel open data projecten door overheden zijn juist om de eigen data te verbeteren door middel van terugkoppelingen van (her)gebruikers. RDW heeft in het persbericht rondom haar proef wel degelijk iets hierover gezegd:

Met de proef wil de RDW zelf ervaring opdoen met open data, ook om de kwaliteit van de gegevens eventueel te verbeteren.

In de achterliggende website is over deze terugkoppeling trouwens weinig te vinden (het woordje eventueel is misschien in dit licht ook ongelukkig gekozen), maar het genoemde emailadres is hiervoor volgens mij wel degelijk bedoeld. De constateringen van Ted en anderen zijn dus zeer zinnig en ik juich het alleen maar toe om deze kennis met de datahouder (RDW) te delen.

UPDATE 10-10-2012: RDW heeft inmiddels voor retributies een ander proces voor ogen. Opvallende zaken in de data kunnen worden gepost in een specifieke forumposting in de Google group: http://groups.google.com/group/voertuigen-open-data/t/d2da298f06c27159 en niet per email.

Misleiding of begeleiding?

(Open) data 1-op-1 zonder context publiceren is altijd vragen om problemen. Niet voor niets vragen (her)gebruikers van open data om duidelijke meta-beschrijvingen over hoe en waarom bepaalde data in bepaald formaat is geregistreerd. Met enkele simpele tools zoals Excel draaitabellen kan je namelijk heel snel fraaie dwarsdoorsnedes van elke dataset maken. Bij ongeschoonde data zoals RDW open data is dat niet anders. Van deze data informatie maken waarop beslissingen genomen kunnen worden, is echter nog geen sinecure.

Schoning van data gebeurt ook bij toepassing van RDW data. Zo weet ik dat Belastingdienst wel degelijk nog een ander veld bijhoudt rondom BPM, nl. de daadwerkelijk betaalde BPM (grote wens om deze nog eens te ontvangen in wat voor dataformaat….). Daarnaast weet ik ook dat Belastingdienst het gewicht ook nog schoont op “fouten”. Zo worden bijvoorbeeld bij diverse hybrides extra gewichtskortingen toegepast, omdat accupakket niet meegerekend hoeft te worden.

Ook bij mijn werkgever maken we schoningsprocessen om de data juist te verwerken voor onze doeleinden. Hierbij houden we de bron in stand, maar geven we er ook een bepaalde context aan. Zo is bijvoorbeeld het veld cilinderinhoud bij auto’s uit begin jaren negentig en daarvoor nauwelijks gevuld bij RDW. Als je op dit type veld voor deze groep auto’s beslissingen wilt nemen, zal je toch echt een andere bron moeten gebruiken. Zo heeft elk veld mitsen en maren. Dit vereist begeleiding om misleiding te voorkomen.

Open data zonder meta-gegevens gebruiken geeft risico’s op creeren van misleiding. Dit behoeft dus begeleiding. Deze begeleiding kan van de datahouder komen, maar ook van de ervaren specialisten van deze data.

Terugkoppeling

In het kader van terugkoppeling hoor ik graag wat andere mensen vinden

4 gedachten over “Maakt RDW potje van kentekenregister? Ik denk het niet!”

  1. Helaas maakt de RDW wel fouten: Ik heb 4 oldtimers gehad: de 1e heb ik gesloopt gekregen en dit gemeld bij het postkantoor. (voor de veren van een kever 1302) nadien nog voor bij de RDW – Veendam geweest. De 2e was een zilver bug: deze zou omgebouwd worden en heb ik ook mee gereden, de 3e was op de laatste dag van de APK en heb ik geprobeerd nog naar huis te rijden. Halverwege liet die het afweten maar goed: die was voor de onderdelen bedoeld. De 4e was alleen een kenteken met uitgezaagd chassisnummer die ik gelijk geschorst heb. Alle auto’s zijn uiterlijk 2008 van de weg gehaald en tig maal heb ik nu gemeld dat ik geen auto ‘s meer heb.
    Vandaag zit ik dus bij een ambtenaar van de gemeente die probeert te bemiddelen: mijn boetes bedragen inmiddels ca 40.000 euro dus 3 x 800 dagen gijzeling aangezien ik niet kan betalen.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *