Wat is een data broker

Een data broker slaat geen data op (by default); het verzamelt informatie uit verschillende bronnen; verwerkt het om het te verrijken, te verbeteren of te analyseren; en kan de data in licentie geven aan andere Organisaties. Data brokers kunnen ook rechtstreeks een licentie voor de gegevens van een andere organisatie geven of de gegevens van een andere organisatie verwerken om betere resultaten te behalen. Gegevens worden doorgaans benaderd via een Application Programming Interface (API) en hebben vaak betrekking op abonnementsovereenkomsten. Gegevens worden doorgaans niet 'verkocht' (d.w.z. het eigendom ervan overgedragen), maar worden in licentie gegeven voor bepaald of beperkt gebruik. (Een data broker wordt ook wel een information broker, syndicated data broker of information product supplier genoemd.) Een data broker is dus nodig om data te delen tussen verschillende rollen in het ecosysteem zoals data producent, consument, prosument, model producent, city administratie, ... waarbij deze rollen "verifieerbare data organizaties" zijn. Een Data Broker treedt dus op als een "middle man" tussen data producenten en consumenten.


Data Marketplace

Vaak vervult een Data Broker ook de rol van data marketplace. Deze monetariseert de informatie die het doorgeeft aan de hand van een aantal modellen. Voorwaarden om data af te nemen van een data broker die fungeert als marktplaats zijn bv:

  • pay-per-use: gebruikers moeten betalen voor de gegevens die ze gebruiken
  • abonnement: gebruikers betalen een vast bedrag
  • geven en nemen: bebruikers kunnen de gegevens gratis gebruiken als ze ook gegevens aan de makelaar verstrekken.

Data Catalogus

Aangezien een data broker mogelijk een groot aantal gegevenstypen kan bedienen, moet er een methode zijn om dit door een klant doorzoekbaar te maken. Hiervoor is een datacatalogus nodig. Deze catalogus biedt gebruikers een gestructureerd overzicht van de informatie-elementen. Aangezien de gegevens doorgaans gestructureerd zijn en onderling gerelateerd zijn. Voorbeelden hiervan zijn luchtkwaliteitsgegevens en weergegevens. Voor beide is het van belang dat duidelijk is wanneer en voor welke locatie ze zijn geregistreerd. Deze catalogus wordt vaak de knowledge graph van de broker genoemd.

Naast de feitelijke gegevens bevat de knowledge graph ook gegevens die de gegevens beschrijven (bijv. Bron, eigenaar). Dit wordt metadata genoemd. In het kader van VLOCA is de knowledge graph gebaseerd op de smart city domeinen

Data Access

Een data broker moet niet alleen de toegang van een user regelen, maar moet de toegang tot de gegevens die hij bedient beheren; de toegangsbeheer moet fijnmazig zijn: tot welke gegevenselementen (bv. luchtkwaliteit) een klant toegang heeft, maar ook eventueel zijn toegang beperken tot bepaalde geografische regio's. Bovendien moet het beheren hoe de gegevens worden gebruikt (datasoevereiniteit). Een klant die de gegevens gratis ontvangt voor bijvoorbeeld veiligheidsredenen mag deze niet opslaan voor historische analyse.

Schaalbaarheid

Een data broker moet potentieel grote hoeveelheden data leveren aan users/clients. Gegevens die mogelijk afkomstig zijn van diverse, geografisch ver verwijderde bronnen. Een data broker moet daarom schaalbaar zijn door het ondersteunen van "federation": de data broker zal niet één instantie zijn, maar een gedistribueerde set van data broker, die naar behoefte kan worden geschaald.

Security

Toegangscontrole is slechts een onderdeel van het beveiligen van een data broker. Een Data broker moet ook ervoor zorgen dat de gegevens op een veilige manier worden overgedragen. Ook zijn de gegevens die via de gegevensmakelaar worden geïnjecteerd afkomstig zijn van een vertrouwde bron. Daarom heeft een data broker fijnmazige mechanismen nodig om te garanderen dat de data wordt aangeboden betrouwbaar is en wordt gecommuniceerd met vertrouwde partijen.