Datum
03 maart 2021
Deelnemers
- Bart Wyns
- Danny Willen
- Annelies De Craene
- Annelien Dierick
- Helena Schulpé
- Rik Hendrix
- Geert Limpens
- Lode Nulens
- Mathias Van Compernolle
- Justine Ottevaere
- Philippe Michiels
- Reinhard Stoop
- Bart Scheenaerts
- Silke Steijns
- Stefan Lefever
- Luc Stinissen
- Dimitri Van Baelen
- Barbara Van Broeckhoven
- Mieke Van Cauwenberghe
- Triangle Koen
- Ziggy Vanlishout
- Tim Guily
Presentatie
| VLOCA Traject Data Broker - Tweede Sessie - Presentatie
Agenda
Inleiding & reflectie vorige workshop
We proberen in deze workshop richting te geven aan wat een Databroker betekent en vertalen wat dit betekent voor Vlaanderen en de Steden -> streven naar samenwerking en verbinding. Doel van het databroker VLOCA traject is om Smart City bouwstenen te definiëren en te selecteren die voldoen aan VLOCA standaarden, silo's binnen de overheden vermijden en net data te activeren en te connecteren die leidt tot Smart Data Management. We willen daarbij niet alleen binnen de stad te kijken, maar ook breder zodat data kan worden geconnecteerd met andere platformen/databronnen (eg stedelijke data connecteren met modellen/simulatie data of met vb. een mobilidata databroker). Doelstelling van deze databroker sessie was ook om een aantal principes te aligneren in het kader van de relance nota. Linken van de behoeftes van steden met regio’s en die op elkaar afstemmen.
Welke rol speelt een databroker:
- In Gent Databroker gaat het over een city (of things) data broker, met aandacht voor het economische, technische, legale en functionele plaatje. Daarbij zijn specifieke keuzes gemaakt voor bijvoorbeeld het gebruik van Linked Data
- Aanbesteding Brugge gaat over een smart city data platform
- In Antwerpen heeft ACPAAS ook het doel om te evolueren naar een generiek data platform
- Deze initiatieven geven aan dat er verschillende ambities en initiatieven zijn die elkaar kunnen versterken.
Maar er zijn veel uitdagingen en vragen:
- Software/data engineering en onderhoud
- Open Source is goed, maar vraagt ook onderhoud
- Evolutie van standaarden: hoe managen?
- Data governance & architecture?
- Waar kan Vlaanderen de steden ontzorgen?
- Kan er sprake zijn van totale ontzorging?
- Meer genuanceerd: welke elementen worden beter op regionaal niveau opgelost en welke lokaal?
- Hoe kunnen de steden aligneren met de regionale ontzorging?
- En bijvoorbeeld zich groeperen om economies of scale te krijgen?
- Conflicteert het initiatief van B/R/L met relance plan? (sensorplatform bijvoorbeeld)
We kunnen daar vandaag al enkele richtinggevende antwoorden op geven:
- Relanceplan gaat geen monoliet platform in de markt zetten
- Focus op
- Standaarden
- Open source componenten en tools
- Drempelverlagend voor publicatie van open linked data
- Het [Data-nutsbedrijf] kan zeker een rol spelen in realisatie van het relance plan, maar is nog in volle definitie
- Data governance zou een gedeeld probleem moeten zijn (regionale, lokale overheden ism industrie)
- Ontzorging van steden op de goeie plaatsen is de uitdaging
Doelstelling van deze workshop:
- Terminologie afstemmen rond databroker
- Aangeven waar een databroker een rol opneemt in het federated landschap
- Aantonen dat allignering met de verschillende initiatieven mogelijk is
- Smart Data Management vraagt een holistische benadering
Nood aan een gelijkaardige terminologie:
- Big Data is een vrij complex gegeven en evolueert door heen de tijd (3v’s -> 17v’s)
- Daarom nood om een eenduidige definitie rond termen en concepten af te spreken voor Vlaanderen
- Deze definities en termen zijn open voor co-creatie dus er is een uitnodiging om hier feedback over te geven op de kennishub
Terminologie
De terminologie rond een data broker vereist eenduidigheid. In dit traject kunnen we hier over co-creëeren.
- Wat is een smart data architecture (regionaal/gefedereerd niveau)?
- Wat is een smart city (data) platform?
- Wat zijn belangrijke data eigenschappen en hun doelstellingen?
- Wat zijn belangrijke data management capabilities?
- Wat zijn belangrijke data definities?
Dit kunnen we tracken en definiëren op Termen en concepten
- Wat is smart data (zie slide): From Big data to Smart Data
- Smart data management en Smart Data governance zijn belangrijk
- Samenwerking is nodig met het data landschap en hier kan een data broker een belangrijke rol spelen
- Daarom dat het nuttig is dat VLOCA hier draaiboeken voor maakt en dit zorgt ervoor dat niet iedereen op zijn eiland werkt, maar dat we op een gestructureerd manier samen werken waardoor data makkelijk kan vloeien en kan samen werken om uiteindelijke meerwaarde te creëren in nuttige applicaties.
- Het beheren van Smart data houdt veel capabilities in
- Ook hier gaan we een aantal definities in VLOCA rond voorstellen - hierdoor kan er naar worden verwezen in aanbestedingen met als doel dat we uniforme termen gebruik en implementeren.
- Terminologie is belangrijk in dit verhaal en zorgen dat we dezelfde mentale concepten begrijpen
Wat is een data broker (component) ?
Inzoomen op een data broker: wat is het en wat is het niet? Een eerste aanzet is te vinden op Data broker. Er bestaan hierin verschillende instanties met een ander niveau van detail: City Data Broker, Regional Data Broker, Departementale Data Broker, Mobiliteits Data Broker, ... Alsook verschillende maturiteitsniveau ’s. De term wordt vaak breed gebruikt. De vraag is dan hoe dit te kaderen en plaatsen in het landschap. Databrokerage is een element van heel veel capabilities van een Smart City omdat dat broker veel domeinen aanraken hebben we in VLOCA een stap terug gezet en is er gekeken naar een breder concept: Smart Data Management.
Tijdens de sessie wordt een eerste conceptuele versie van hoe dit vandaag is gedefinieerd voorgesteld en feedback is welkom. Een aantal principes/domeinen van Smart Data Management worden besproken in de slides (eg. Dat Capture, Storage to scale, Process & Transform, Compute domein, Service laag,...). De Databroker maakt dus een onderdeel uit van een smart data management. En Smart Data management wordt gekoppled aan een virtual Smart Data Platform. (Virtual = omdat het bestaat uit verschillende tenants/Instantiaties)
Verschillende data bronnen moeten over verschillende lagen/gebruikers kunnen worden gedeeld. Via een Virtueel Smart Data platform en een federated aanpak wordt dit gefaciliteerd.
Data Publishing
Een belangrijke data management capability is data publishing, en is 1 van de speerpunten in het relance plan van AIV. Hoe verhoudt zich dat tot voorgaande topics en waar komen ze samen?
Hoe maken we van real time sensordata een belangrijke hefboom voor duurzame groei van de Vlaamse data-economie? Huidige platformen zijn niet altijd geschikt om grote volumes sensordata aan te bieden op een kostenefficiënte manier. Smart city toepassingen zijn vandaag nog te veel maatwerk en onvoldoende schaalbaar. Sensordata ontstaan in silo’s en bieden op zichzelf onvoldoende meerwaarde voor nieuwe business modellen, niet gestandaardiseerd. Een dreigende vendor lock-in op sensordata en geconsolideerde smart city markt vormt een sterke rem op de innovatie. Wat zijn de doelstellingen en welk effect beoogt AIV met het ‘sensor data platform’ dossier? Sensordata zijn een groeimarkt voor de data-economie van morgen.
Doelstellingen
- Herbruikbare open source componenten aanbieden aan de markt die kostenefficiënte publicatie van grote volumes sensordata in real time toelaat – interoperabiliteit
- Inzetten op open standaarden zodat sensor data sensoragnoistisch wordt en loskomt van de leverancier van de sensor en vlot gerelateerd kan worden aan slow moving data (vb basisregisters)
¨*Ecosysteem van samenwerkende sensordata platformen tot stand brengen
Business voordelen
- Innovatiesnelheid en time to market van Vlaamse bedrijven gevoelig verhogen -> veerkracht van de Vlaamse bedrijven stimuleren
- Realtime en gepersonaliseerde data zijn een vereist voor digitale transformatie
- Self service by design en betaalbaar te gebruiken door de gehele markt (incl KMO)
- Zowel aan publicatie als aan gebruikers kant zorgen duurzaam data publiceren op een interoperabele manier
- Verder bouwen op OSLO
- Hergebruik toelaten en ervoor zorgen dat de data vindbaar is voor mens en machine
Hoe wilt AIV dit bereiken?
- Standaarden ontwikkelen en implementeren dus ook voor LDES
- Ecosysteem en community
- Samenwerking publieke, private en academische wereld (inclusief de developers community)
- Governance
- Bouwblokken aanbieden als managed services
Walk trough door het Functionele Architectuur Ontwerp (ontwerp - nog niet finaal) - Volgende domeinen werden besproken (voor details zie slides)
- Ruwe datastroom publiceren als interoperabele linked data stroom, linked Data event streams zijn het uitgangspunt
- LDES(Linked Data Even Stream) Projecties voor verschillende doelen, afgeleide datastromen creëren die terug worden gepubliceerd als linked data even streams. Hierbij is mapping tussen APIs ook belangrijk. Het systeem is modulair, dus er kan worden gekozen welke componenten uit de projectie client wel of niet worden geïmplementeerd.
- Verschillende LDES clients voor verschillende doelen zijn mogelijk. Bijvoorbeeld: In sommige use cases is het belangrijk om data op te slaan om bijvoorbeeld YTT scenario’s toe te laten.
- Vindbaarheid, herkomst van de data. Belangrijk dat de data vindbaar is voor mens en machine inclusief de bijsluiter van de data. (cfr een metadatacatalogus)
- Ontsluiten van data voor een fit for purpose manier. Hiervoor ook afstemmen op gebied van de opslagmethode
Open Discussie
- AS IS => terugkoppeling naar de platformen uit de eerste aanbesteding: ACPAAS, Smart City Data Platform aanbesteding Brugge, VLAIO Data Broker Gent
Welke componenten zitten hier in. Wat is het City Data Brokering doel, en hoe kunnen deze platformen ook ingeschakeld worden in een Regional Data Broker?
- TO BE => Waar willen we naar toe en welke realiteit van data brokerage op bv regionaal niveau ambiëren we?
Hoe gaan we verder, waar werken we samen aan (bv op de kennishub). Is er nood aan nog een workshop?
Reinhard Stoop:
- Men gaat niet uit van 1 groot platform, maar modulair en federated aanpak is een goede zaak. Dus verschillende platform ipv 1 groot platform ?
- Dat is inderdaad het doel en een samenspel van interoperabele componenten en dus geen grote monoliet
- Sensoren die lichten moeten aansturen hebben een andere SLA bv. wegens operationaliteit
- Sommige datastromen hebben een bepaalde SLA en belang -> waardoor ze op een andere manier moeten worden behandeld en mogelijks afgescheiden datastreams nodig hebben
- Zit er in de data governance aspect van Vlaanderen ook iets rond standaarden on edge waardoor het doorvertalen en omzettingen vermeden wordt en dat de data dan al direct op de juiste manier beschikbaar gesteld door sensorleveranciers
- We moeten het hergebruik van standaarden proberen aan te moedigen en dit moeten we doen via VLOCA
- Hierdoor een VLOCA compliant score uit denken die kan worden toegepast in aanbestedingen
- Ook de volledigheid van de data is belangrijk omdat je geen informatie mag missen voor modellen
- Fit for purpose vs fit for model - dit kan andere requirements hebben
Danny Willen:
- Hasselt is bezig met een referentie architectuur voor een breed data platform en hiervoor onderzoekt hij ook het concept van de Databroker:
- Zou voornamelijk de service laag vervullen en de data capturing / misschien wat governance
- Wat verrast rond processing en ML dat die als een capability van data broker worden gezien
- Gaat de databroker toch verder dan pub sub van de data en dus ook verwerking van data meenemen?
- Klopt, de definities zijn uitlopend, maar puur volgens de term van brokerage is data brokerage een middelman die connecties legt
- Maar het Smart Data Management gaat net breder en neemt diverse domeinen mee, zodat die kunnen worden vertaald naar een technische architectuur en technische componenten.
- Voor Urban Digital Twins zijn modellen belangrijk en daarom benadert deze voorstellen het breder
- Hoe ga je van dit concept naar materialisatie?
- Welk deel laten we afdekken door een databroker van Vlaanderen en welk deel moeten de Steden zelf ontwikkelen?
- VLOCA = conceptuele architectuur oefening
- Maar er wordt gesproken over tenants - dus wil dit dan toch zeggen dat er een implementatie komt waar de lokale overheden van kunnen afnemen?
- Er zullen centrale componenten waar lokale overheden kunnen van afnemen -> vermijden van het wiel opnieuw uit te vinden
- Maar VLOCA is inderdaad een conceptuele oefeningen, implementatie zal in andere projecten gebeuren
- De ambitie moet zijn om naar een open ecosysteem te evolueren om samen te werken. Er is de visie om te evolueren naar een makkelijkere en gedeelde manier van data te delen
- Leeft het idee om dit te implementeren?
- Ja, de volgende stappen zijn:
- De technische architectuur beschrijft de componenten
- En de kwantitatieve en kwalitatieve componenten beschrijven
- Omdat je dan op basis van de behoeftes consequenties kan definiëren en deze zaken mee nemen in aanbestedingen
- Wil Vlaanderen een platform aanbieden?
- Er is te bekijken op welke manier dit past in het relance plan en hoe dit wordt geïmplementeerd
Tim Guily:
- Het is een combinatie van verschillende platformen of componenten?
- Beiden - aaneenschakeling van componenten die een platform kunnen worden
- Is de markt klaar voor deze aanpak? omdat er wordt geraakt aan een aantal business modellen van industrie spelers:
- Want Steden willen wel nog met mature producten over blijven on the long run en niet werken met POCs
- Voldoende vinger aan de pols bij de markt om te voelen dat ze er klaar voor zijn?
- Business impact is belangrijk, maar daarom dat we ook een VLOCA compliant score aanmaken zodat in aanbesteden er kan worden geëvalueerd in welke mate aanbestedingen in lijn zijn met de visie
- Op deze manier kan er stap voor stap worden geëvolueerd naar Smart Data Management
- Bepaalde zaken moeten ook een wetgevend kader krijgen (eg OSLO)
- En imec krijgt in Coock Open Stad wel positieve signalen van de markt/industrie om mee te werken
Toevoeging van Reinhard via de chat:
- Wat de vraag 'wat ontbreekt nog?" betreft denk ik dat zeker GIS als geo data met eigen specifieke standaarden nog zijn plaats moeten krijgen , ook in het compute onderdeel zou dit een plaats moeten krijgen. GIS analyse is vrij specifiek. In een stedelijke omgeving is geo vrij key niet enkel als context element maar ook als datakey, als analyse element en als outcome , wie wat , waar .
Na deze gesprekken werd er teruggekoppeld naar waar we zijn geëndigd in de vorige Workshop.
Voorbeeldaanbesteding Brugge / Roeselare / Leuven:
- Bestaat uit componenten en een modulair platform
- De vraag is dus hoe kan Brugge hierop aligneren
- Voor elke component is er een korte toelichting gegeven in het bestek
- Niet alles is must have voor Brugge omdat bepaalde
- Zij willen eerst (1) data stromen hebben en ze daarna (2) onboarden en daarna (3) ontsluiten (naar een Urban Digital Twin / open data platform)
- Hoe past een smart data platform met een Digital Twin / Modellen / Mobilidata platform? -> zijn zaken die in het Urban Digital Twin VLOCA traject worden opgenomen
Korte update van Reinhard over GIP Antwerpen - Generieke IoT data Platform
- In het kader van Europees project gebouwd
- Open Source en operationaliseren van dit platform kost geld
- Er wordt nu een evaluatie gedaan van het platform om te bekijken in welke vorm dit wordt verder gezet
- Zij willen ook beslissingen nemen rond standaarden en welke componenten ze zelf willen aanmaken
- Ze willen dus een aantal beslissingen nemen en stappen zetten rond mobiliteit en water
Leuven vindt dat ze nu een groot risico nemen om te starten met een Smart Data Platform. Want de oplossingen zijn belangrijk (in en output van data). Maar ook het gebruiken van het Smart Data platform en de ontwikkeling - want hoe meer het wordt gebruikt hoe duurder het wordt. Er zijn 2 dingen waarop moeten worden gewerkt en waar steden ondersteuning voor nodig hebben: oplossingen (=input en output / use cases) en het platform zelf – te bekijken hoe deze beide paarden aan hetzelfde tempo kunnen blijven lopen.