Deelnemers

  • ABB
  • MOW
  • Stad Kortrijk
  • VITO
  • Imec
  • Stad Antwerpen
  • Stad Mechelen
  • MIVB

Inleiding

Spreker: Fabian de la Meilleure (ABB)

Fabian gaf een korte inleiding met verwelkoming en uitleg over de agendapunten van vandaag. Local Digital Twin bevat heel veel onderdelen waarvan o.a. de architecturale component.

De focus ligt op 3 centrale thema’s: Verkeer, luchtkwaliteit en geluid. Hieruit komen ook meerdere cases zoals getoond via de demo van Duet uit sessie 1.

Recap: Framing Digital Twin

Spreker: Koen Triangle (Imec)

Maatschappelijke evolutie: De maatschappij waarin wij leven heeft reeds een aantal industriële revoluties gekend om vandaag te komen tot een society 5.0: Super Smart Society met een focus op AI, blockchain en digital twins. Deze technologieën zijn gedreven door data.

Concept Digital Twin: Het concept van Digital Twin bestaat al langer maar kan ingezet worden als datagedreven beslissingstool. Deze geeft een virtuele voorstelling van entiteiten en processen. Een Digital Twin maakt gebruik van data op basis van een bepaalde frequentie. Het is niet altijd real-time maar in functie van de dienende case. Data en modellen moeten correct, betrouwbaar en transparant zijn. Cross-domein inzichten, horizontaal over de domeinen zijn mogelijk. What if vragen en scenario’s kunnen worden gebruikt. Dit alles om te komen tot “evidence based” besluitvorming.

Data-gedreven overheid & principes: Het concept van de data-gedreven overheid leeft al in steden, waarbij een Digital Twin een rol kan spelen in een aantal beslissingsfasen van het beleidsproces. Het is belangrijk dat je data gebruikt in functie van het beleid, waarbij bepaalde principes in rekening worden gebracht, denk aan toegankelijkheid, vindbaarheid, veiligheid, uitwisselbaarheid etc. Vanuit de DIKW (Data – Information – Knowledge – Wisdom) pyramid voeg je bij elk laag informatie toe om bepaalde beleid mogelijk te maken.

Praktisch beginnen: Hoe begin je er daar nu aan? Het kan helpen om eerst over de ambitieniveaus van de open Digital Twin na te denken. In functie van een bepaalde case of van bestaande systemen binnen de organisatie kan je nagaan hoe ver je wenst te gaan. Waar zit je als stad? Tot waar reikt je ambitie? De VLOCA Donut kan uitgebreid worden met de Digital Twin Capability Periodic Table die technologische capaciteiten weergeeft. Dit kan een basis zijn om uit te kiezen.

Doelstelling sessie: In deze sessie focussen wij op de onderste componenten van de open Digital Twin. Daarnaast is er ook het analytische gegeven. Een case zien wij als een circulatieplan en een scenario als verschillende opties die een beleid in overweging neemt vooraleer tot een keuze te komen. Luchtkwaliteitsdata van een sensor kan een drift hebben en ook deze variatie kan begrepen worden als eindgebruiker.

Vandaag ligt de focus op data maar dit is maar een parameter in de vergelijking van een beslissing. Je moet deze ook kunnen visualiseren en interpreteren. Experten zijn hierbij nodig. Daarnaast is de cultuur ook belangrijk om te komen tot beslissingen. Dit bevat de structuren, de governance en het belang van data in de organisatie.

Vragen/opmerkingen:

Hendrik Meynen (MIVB) vindt de ambitieniveaus helder om zo weer te geven hoe een Digital Twin stapje per stapje gerealiseerd kan worden.

Recap: Conclusies Interviews

Spreker: Maxim Chantillon (Imec)

Methodologie: Acht centrumsteden zijn geïnterviewd over data-gedreven beslissingsprocessen binnen het beleidsthema “duurzame leefkwaliteit” (omvat verkeer, luchtkwaliteit en geluid). De focus lag daarbij op (1) het huidige beleid en de organisatie, (2) de beleidsprocessen, (3) de huidige noden en (4) de toekomst. Op basis van de geidentificeerde uitdagingen zijn wij gaan nadenken over mogelijke oplossingen voor deze uitdagingen.

Uitdagingen: Een aantal uitdagingen werden geïdentificeerd door de deelnemers als zijnde cruciaal. Deze kunnen als volgt samengevat worden:

  • Data:
    • Datakwaliteit en bijhouden data
    • Datastandaardisatie & kennis over standaardisatie versterken bij lokale overheden
    • Datakoppeling & relatie tussen dataleveranciers, zowel binnen de publieke sector als in relatie tot externe niet-overheidsactoren (vb. private sector).
  • Samenwerking:
    • Opbouwen gedeelde infrastructuur tussen lokale overheden, en in relatie naar hogere overheden.
    • Uitbouwen van relatie tussen publieke sector en de private sector
  • Andere:
    • Relevantie Digital Twin aantonen zodat ook andere beleidsactoren toegevoegde waarde zien (vb. politieke niveau).
    • Een aantal moeilijkheden blijven om te evolueren van de theorie naar de praktijk (juridisch / financieel / ...).

Oplossingen: Tijdens de workshop werd door de deelnemers nagedacht over hoe deze uitdagingen kunnen omgezet worden in werkbare oplossingen, daarbij was het belangrijk om te denken aan oplossingen die kunnen gelinkt worden en/of uitgewerkt worden in het kader van VLOCA.

Voor wat betreft de uitdagingen rond data kwamen de volgende oplossingen naar voren:

  • Datakwaliteit en bijhouden data
    • Datakwaliteit controleren via tooling
    • Gebruik en implementatie van Smart Data Principes & Data Governance
    • Opzetten dataportaal voor dataleveringen en -validatie
  • Datastandaardisatie & kennis over standaardisatie
    • Inzetten op Vlaamse trekkersrol
    • Gebruik standaarden in aanbestedingen
    • (verder) Ontwikkelen van EU/VL bouwblokken
    • Verdere uitbouw VLOCA Kennishub
    • Opzetten domeingebonden data spaces & Central Data APIs
  • Datakoppeling & relatie tussen dataleveranciers
    • Gebruik en implementatie van Smart Data Principes & Data Governance
    • Opzetten Central Data API’s

Voor wat betreft de uitdagingen rond samenwerking kwamen de volgende oplossingen naar voren:

  • Samenwerking interne publieke sector & relatie met private sector
    • Opzetten Vlaamse Digital Twin Community
    • Verder bepalen standaarden
    • Stimuleren gebruik authentieke bronnen
    • Opleggen minimale standaarden
  • Opbouwen gedeelde infrastructuur
    • Gebruiken van VLOCA traject(en) om duurzame samenwerkingsverbanden op te zetten

Voor wat betreft de uitdagingen rond de relevantie van een Digital Twin en het omzetten van theoretische doelstellingen in de praktijk kwamen de volgende oplossingen naar voren:

  • Relevantie Digital Twin aantonen
    • Begin klein, met praktische use cases
  • Evolutie theorie naar praktijk (juridisch / financieel)
    • Verdere uitbouw van kennis op VLOCA Kennishub
    • Opbouwen lange termijn implementatie via VLOCA traject
    • Gedeelde infrastructuur als middel om kost te drukken
    • Innovatie via samenwerking met industrie

Vragen:

Martine Van Poppel (VITO): Zijn er plannen om ook de industrie te bevragen over hoe zij het delen van data zien in de context van een Digital Twin?

  • Koen Triangle: In het kader van dit traject is het de bedoeling om ook met de industrie af te toetsen hoe zij de invulling zien van een Digital Twin en toegevoegde waarde kunnen hebben voor de geïdentificeerde noden.

Smart Data uitgelegd

Spreker: Tom Bergmans (Imec)

Opname: De opname van dit onderdeel is beschikbaar via deze link.


Eerst focussen op het strategisch element en daarna op data. Er zal ook gewerkt worden met een voorbeeld case.

Van Big Data naar Smart Data: Big Data maakt een evolutie door naar Smart Data. Big data wordt aan een hoog tempo gegenereerd en data komt in alle kleuren en geuren binnen. De 4 Big Data V’s geven de problemen mee waar data mee te kampen hebben: Velocity, volume, variety en veracity. De Big Data definities van Volume, Velocity, Variety en Veracity zijn gedefinieerd op deze VLOCA Kennishub.

Smart Data: Wat is Smart Data? Hierbij zal aan de Big Data een kwaliteitslaag toegevoegd worden en zullen principes zoals FAIR toegepast worden. Er is een nood aan het feit dat verschillende profielen (denk aan inhoudelijke experten, data experten en beslissers) dezelfde termen rond data gebruiken. Security focust op rechten waar protection de inhoud van de data beschermt. Semantics beoogt een gedeeld begrip van de data.

Data als Assets: Het is belangrijk te realiseren dat data als assets een shift in mindset nodig heeft. Data wordt daarbij gezien als een cruciaal element voor beslissingsnemers, en diezelfde data kan leiden tot datagedreven beleid.

Data at type level versus data at value level: De eerste categorie bevat data als metadata, de tweede bevat de inhoud van de data zoals de tekst. Dit verschil is expliciet gemaakt omdat deze andere processen ondersteunen en andere componenten bevatten. Deze opsplitsing is cruciaal. Er is geen overkoepelende app. Er is wel een alignering van bedrijfsprocessen en cultuur nodig om het volledig proces te ondersteunen.

BPMN Flow uitgelegd: Er wordt voor het voorstellen van de BPMN Flow gebruik gemaakt van de imaginaire stad Brugland die graag de lucht- en geluidskwaliteit wenst te verbeteren om zo de leefbaarheid te verhogen. Dit moet leiden tot een data gedreven beslissing. Hiervoor is een evidence-based systeem nodig.

BPMN flow bestaat uit 4 lanen:

  • Business/decision making lane
  • Data governance & management lane
  • Model governance & management lane
  • Application lane

Onderaan wordt aangegeven welke componenten overlappen met welk onderdeel.

Er is een perfecte mapping op het model dat VLOCA hanteert met dezelfde principes. Het proces begint met de business lane, waarbij er een heldere formulering is van de uitdagingen en de doelen. Aan elk element wordt een beschrijving toegevoegd. Voor luchtkwaliteit is dit bijvoorbeeld het volgende: Welke standaard gebruiken wij (vb. Belaqui)? Willen wij de snelheid of de verkeersintensiteit verbeteren? Voor elk concept in onze probleemstelling moeten wij komen tot een quasi wetenschappelijk begrip van wat er precies beoogd wordt. Als stap 1 en 2 specifiek gedefinieerd worden, dan verloopt het het oplossen van de volgende stappen efficiënter. Deze eerste stappen zijn zeer cruciaal voor het hele proces.

Onder de assumptie dat de eerste stappen nauwgezet zijn opgenomen kunnen wij de doorvertaling maken naar de data kant. Dan komen wij tot het data engineering luik.

De derde stap, die van het model management, is niet altijd nodig maar wel indien er gebruik wordt gemaakt van modellen om te komen tot predicties maar ook indien er een ‘hertraining’ van modellen is (kan verlopen via een iteratief proces). Het doel is om zo transparant mogelijk te zijn hierover, aangezien dit van cruciaal belang is voor de geloofwaardigheid van het latere beleid. Het is nodig de black box beslissingen zo veel als mogelijk te vermijden, en daarbij o.a. zicht hebben op de data die gebruikt is om het model te trainen en op de modellen zelf. Zo kan bijvoorbeeld een model getraind in de VS mogelijks niet nuttig zijn voor een toepassing In Vlaanderen. Wij moeten weg van hidden feature engineering zodat data stap gevisualiseerd en geïnterpreteerd kan worden door de betrokken actoren.

Het is belangrijk om een bepaalde studie niet eenmalig te gaan doen maar om de datasets meermalig te doorlopen en verschillende opties af te wegen. Ideaal is het dus dit geen lineair maar een iteratief proces. Een buikgevoelsbeslissing of waarzeggerij moet evolueren naar een wetenschappelijk verhaal, waarbij het ultieme doel is om tot een zo wetenschappelijk mogelijk onderbouwing te komen.

Vragen/opmerkingen:

Wim Michiels (Imec): Je moet de mogelijkheden ook duidelijk beschrijven om te verzekeren dat je de nodige data verzameld, en geen overbodige data. Ook van belang is om een statistische basis te hebben en te kunnen gebruiken. Zo kunnen percentielen over een hele periode ook mogelijkheden bieden op vlak van statistiek en model lane (rebranded).

FAIR Data Principes: Toelichting

Spreker: Martine Delannoy (Imec)

Opname: De opname van dit onderdeel is beschikbaar via deze link.

Onderzoek: SMIT & Imec, 2022.

Evolutie van big data naar smart data: We willen dat de Big Data kan evolueren naar Smart Data. Zo’n evolutie vraagt een aantal aanpassingen, zoals het toepassen van de FAIR Principles. Cruciaal is dat het gebruik van een Digital Twin vertrouwen schept, daarom is het belangrijk dat we de data kunnen vertrouwen. Hoe kunnen we er voor zorgen dat er vertrouwen is in wat uit de Local Digital Twin komt? Er moet vertrouwen zijn in de data, de modellen, de ontwikkeling van een Local Digital Twin etc. Dit onderzoek werd uitgevoerd door SMIT en Imec.

Vertrouwen in een Local Digital Twin: Vertrouwen in een Local Digital Twin heeft twee luiken. Er is het vertrouwen in de organisatie (en dus de mensen/individuen) en er is het vertrouwen in het ontwikkelingsproces (en dus de technologie, denk aan data, algoritmes, koppeling van data en weergave van data). Vertrouwen in beide zal leiden tot vertrouwen in de Local Digital Twin. De gebruiker zal op die manier de meerwaarde zien, en een perceptie krijgen van het nut en gebruikersgemak.

Vertrouwen in data: Om de Local Digital Twin te vertrouwen is er dus nood aan vertrouwen in de betrokken data. Dit kan versterkt worden door de FAIR Data Principes: Findable, Accessible, Interoperable en Reusable.

  • Findable: De eerste stap bij het (her)gebruiken van data is om ze te vinden. Metadata en data moeten gemakkelijk vindbaar zijn voor zowel mensen als computers.
  • Accessble: Zodra de gebruiker de benodigde gegevens heeft gevonden, moet hij weten hoe deze kunnen worden benaderd aan de hand van authenticatie en autorisatie.
  • Interoperable: De gegevens moeten meestal worden geïntegreerd met andere gegevens. Bovendien moeten de gegevens samenwerken met applicaties of workflows voor analyse, opslag en verwerking.
  • Reusable: Het uiteindelijke doel van FAIR is het optimaliseren van hergebruik van data. Om dit te bereiken moeten metadata en data goed worden beschreven, zodat ze in verschillende settings kunnen worden gerepliceerd en/of gecombineerd.

In deze video worden de FAIR principes toegelicht.

FAIR checklist: Op basis van onderzoek uitgevoerd door SMIT en Imec werd een vragenlijst opgesteld die toekomstige gebruikers van een dataset kunnen helpen om te begrijpen of deze al dan niet voldoet aan de FAIR principes en wat eventuele tekortkomingen zijn. De vragenlijst bevat de volgende categorieën:

  • Data info:
  • Showstoppers
  • Unrefined data
  • Refined data

Smart Data in de praktijk: Workshop

Moderatoren: Martine Delannoy (Imec) / Koen Triangle (Imec) / Maxim Chantillon (Imec)

Notulisten: Steven Degelaen (ABB) / Fabian de la Meilleure (ABB)

Opdracht: Het toepassen van de BPMN Flow in de praktijk, met een focus op de (1) Business/decision making lane en de (2) Data governance & management lane (stap 1 & 2). Daarvoor werd gebruik gemaakt van een beleidsverhaal gekaderd in het cross-domein Duurzame Leefkwaliteit (geluid, luchtkwaliteit en mobiliteit). De groep werd onderverdeelt in twee sub-groepen, groep 1 focuste op luchtkwaliteit en geluid, groep 2 focuste op mobiliteit.

Doelstelling: De workshop had een drieledige doelstelling:

  • Deelnemers verder informeren over de BPMN Flow en deze praktisch laten toepassen door de deelnemers.
  • De VLOCA Kennishub verder voeden met relevante concepten, kennis etc. over het domein Duurzame Leefkwaliteit
  • Het verder versterken en verfijnen van de BPMN Flow op basis van feedback verkregen van de deelnemers.

Uitkomsten: Beschikbaar via dit Miro bord.

Beschikbaar via de volgende links:

Plenaire samenvatting

Sprekers: Maxim Chantillon (Imec) & Stefan Levefer (Imec)

Groep 1 – Luchtkwaliteit en geluid:

Draaiboek: In verband met de luchtkwaliteit is het relevant om te verwijzen naar de door VITO ontwikkelde Blauwdruk voor het opzetten van een gemeentelijk sensornetwerk voor luchtkwaliteit. Deze Blauwdruk is toegankelijk via deze link.

Een aantal conclusies kwamen naar voren:

  • Omtrent de BPMN Flow kwam de volgende feedback naar voren:
    • Voor de start van de BPMN Flow is er waarschijnlijk nog een stap (opsomming van bronnen, gebieden en doelgroepen (bron, plaats, tijd, stakeholder, type van impact/effect) op basis van die oplijsting kan de focus gekozen worden). We vertrokken van een eerder vage case, en die werd specifieker gemaakt via Mechelen en hun Schoolstraat project.
    • Voor het bepalen en definiëren van de concepten (B02) is het zeer belangrijk om de concepten en connecties tussen concepten te bepalen. Ook bepalen wat vb. datakwaliteit is voor de use case. Wat betekend de specifieke context voor onze datakwaliteit en wat we moeten meten? Er moeten zowel functionele als niet-functionele concepten bepaald worden.
    • Eveneens belangrijk, en dit is in relatie tot de data providers en data sets (B03), is om te bepalen of data zelf zal gecreëerd worden of zal aangekocht worden, waar zal deze beslissing genomen worden?
    • Suggestie om B04 voor B03 te laten komen, of toch gedeeltelijk. Zo garanderen dat je al een koppeling hebt met de decision takers, dat helpt om beslissingen te nemen. De rollen en verantwoordelijk zijn belangrijk want niet iedereen is overal aanwezig.
  • FAIR checklist: Vragen over het verschil tussen refined en non-refined data. Een use case is een pipeline, dus daarom moet elke dataset in kaart gebracht worden, want er mag geen faling zijn. Er moet een use case zijn om zoveel mogelijk data te mappen.

Groep 2 – Mobiliteit: Een aantal conclusies kwamen naar voren:

  • De BPMN flow wordt door de eerste groep als nuttig bevonden. Het geeft inzicht in de realiteit en is een nodige en nuttige oefening om te doorlopen. Toont aan dat een samenwerking tussen domeinexperten en technische experten nodig is om een vraagstuk correct te kunnen behandelen. Tegelijk start het model van een rationale aanpak, maar (beleids)beslissingen worden niet steeds op een rationale manier genomen. Dit zou eventueel kunnen meegenomen worden.
  • Voor domein Mobiliteit kwamen een groot aantal ideeën naar boven, waarbij er een aantal cruciale aandachtpunten zijn:
    • (1) nood aan een duidelijke definitie van beleidsdoelstellingen, niet alleen in concepten maar eveneens in meetbare resultaten, dit maakt het opstellen van de vervolgstappen eenvoudiger,
    • (2) data en datadeling wordt vaak bemoeilijkt omwille van privacy moeilijkheden en
    • (3) gekoppeld hieraan is de nood van het verwerven van externe data, wat niet steeds makkelijk en/of mogelijk is. Voor dit laatste punt is er daarom o.a. nood aan een verdere standaardisatie op vlak van concepten en data. In verband met het delen van data kwam ook naar voren dat organisaties moeten gestimuleerd worden (cultuurverandering) om data graag met elkaar te delen en gezamenlijk naar oplossingen te werken.
  • Tot slot werd de FAIR checklist nuttig bevonden, niet enkel voor externa data maar eveneens voor interne data om te bekijken in welke mate het voldoet aan de FAIR principes en het interne data management op orde staat.

Vragen:Hendrick Meynen (MIVB): Hoe wil je use cases mappen?

  • Stefan: Datasets op use cases, want we moeten eens reflecteren over de bruikbaarheid van de use cases. Om zo de herbruikbaarheid van de data set te kennen voor specifieke use cases.
  • Hendrick: probleem is vaak dat use cases toch altijd wat anders zijn en de data dus ook telkens een klein beetje anders zal moeten zijn. Dus we moeten naar een soort van standaard use cases.

Next steps

Spreker: Steven Degelaen (ABB)

Alle verslagen zullen op de VLOCA Kennishub komen. Volgende workshop zal op 26 april (09-12u) doorgaan en zal focussen op de modelering. Alle feedback en suggesties zijn welkom en mogen doorgestuurd worden naar vloca@vlaanderen.be.