Vandaag stuitte ik toevalligerwijs op de site van RDW op een PDF met alle erkende demontagebedrijven (vroeger ook wel sloopbedrijven genoemd) van Nederland per 30 januari 2014. Aangezien voor VWE demontagebedrijven een bestaande doelgroep is waarin veel klanten hebben, wilde ik deze lijst wel eens matchen met onze CRM-database. Daarnaast bedacht ik me dat deze informatie veel toegankelijker gemaakt kan worden voor grote publiek, door bijvoorbeeld een Silk applicatie te maken. Al eerder heb ik met deze technologie ervaring opgedaan bij het maken van TOP100 machtige mensen in automotive en Nederlandse luchtvaartregister.
Hoe deze Silk site gemaakt?
Allereerst heb ik de data in de PDF moeten bevrijden. Hiervoor heb ik meerdere online tools gebruikt. Ik ben even vergeten welke nu uiteindelijk het beste resultaat gaf. Aangezien de data in de PDF in kapitalen was geschreven, heb ik daarna de data netter geschreven met behulp van functie BEGINLETTERS in Excel.
Op basis van deze eerste dataset heb ik toen een testsite bij Silk gemaakt. Aangezien ik vooral een keer met de landkaart functie goed wilde werken van Silk, was ik beetje teleurgesteld dat een aantal markers op de Google Maps buiten Nederland werden geplaatst. Na contact met supportteam van Silk ben ik op hun advies de geocoordinaten gaan verzamelen van de adressen.
De lijst van demontagebedrijven wilde ik verrijken met meer informatie. Al eerder heb ik de site OpenKVK gebruikt voor het opzoeken van enkele bedrijfsnamen. Nu wilde ik door middel van de functie WEBSERVICE in Excel eens kijken of ik hiermee de lijst met demontagebedrijven kon verrijken met KVK-gegevens, waarbij ik hoopte dat ik coordinaten en website zou achterhalen.
Met een beetje pijn en moeite (ik maakte nogal een paar beginnersfouten) kreeg ik het voormekaar om de data te verrijken met de gewenste kolommen. Toen bleek pas dat de kolommen met de coordinaten en website niet gevuld zijn bij KVK, waardoor OpenKVK hier ook niets mee kan. Jammer!
Op zoek naar een manier om de straten, huisnummer en woonplaats te geocoderen kwam ik wederom op de site van Bruce McPherson uit. Deze site heb ik al eens eerder gebruikt voor handige excelsheets waarmee je allerlei zaken kan bewerken. Zo heb ik deze site gebruikt om een datavisualisatie te maken in de vorm van een Sankey diagram.
Al met al kwam ik tot een dataset die ik heb geupload naar Silk.
Het resultaat
Het Silk resultaat is op de volgende URL beschikbaar:
<<< url niet langer meer beschikbaar, zie voor meer info update onderaan posting >>>
Op deze site staan 471 demontagebedrijven vermeldt. Met behulp van de handige zoekfunctionaliteit van Silk is door deze set heen te zoeken.
Het mooiste vind ik de landkaart waarmee je dichtheid van demontagebedrijven over Nederland kan bekijken.
Nieuw voor mij is dat Vijfhuizen de absolute demontagewalhalla van Nederland is. In deze plaats zijn namelijk 26 verschillende demontagebedrijven geregistreerd.
UPDATE april 2017
Silk omgeving van alle demontagebedrijven heb ik offline gehaald en link weggehaald uit deze posting. De data was niet langer actueel. Daarnaast wordt de lijst tegenwoordig in de vorm van Opendata wel actueel gepubliceerd door RDW.