Thematische werkgroep 1

Versie van 22 apr 2024 09:50

Data en informatie werkgroep: Machine Learning as a Service (MLaaS)

Tijdens de eerste thematische werkgroep worden de data en informatienoden van de reeds geïdentificeerde use cases in kaart gebracht. De Werkgroep Data en Informatie staat open voor deelname door de gehele quadruple helix. Vaste deelnemers zijn de leden van het VLOCA-trajectconsortium en stakeholders, die samen de data- en informatienoden in kaart brengen. De verzamelde inzichten worden vervolgens verwerkt om de IT-architectuur verder aan te vullen.

De eerste thematische werkgroep rond 'Groen' vond plaats op 14 maart 2024.

Context

Initiatief

De stad Roeselare beschikt reeds over verschillende machine learning algoritmes die data genereren op basis van fotomateriaal en is hiervoor in contact met verschillende partijen. Deze data wordt gebruikt in zowel operationele processen als bij het nemen van beleidsbeslissingen.

Naast het voeden van eerder traditionele databanken stellen ze die intern ook ter beschikking via GEO loketten, en dit op een automatische manier. Deze kennis en ervaring willen ze verder uitbouwen en de algoritmes en processen tegelijkertijd ter beschikking stellen voor ieder bestuur, gaande van het kleinste lokaal bestuur tot bovenlokale overheden als Vlaanderen. Het concept van “machine learning as a service” laat de gebruiker om gebruik te maken van de data en de algoritmes zonder kennis te moeten uitbouwen van de technische achtergrond. Het moet als het ware een “dummy proof” platform worden waarbij men op een éénvoudige manier kan kiezen uit een overzichtelijke catalogus en kunnen “inpluggen” voor de processen die men nuttig acht. Door deze ontzorging kunnen meer besturen stappen zetten richting een sterker data gestuurde beleidsvorming en –voering.

Met het streven naar het opschalen van bestaande machine learning processen, het uitrollen van nieuwe mogelijkheden en deze via een platform als een service ter beschikking te stellen van alle overheden willen ze niet alleen zorgen voor meer data op Vlaams niveau maar ook voor “massa productie” aan een betaalbare prijs.

Groen inventarisering is een van de toepassingen binnen het MLaaS-project. In het bestuursakkoord van Roeselare werd de doelstelling opgenomen om 100.000 extra bomen te planten tegen 2025. Hiervoor was het nodig om zicht te krijgen op het bestaande aantal bomen. Om dit zo efficiënt mogelijk aan te pakken, wenste men in te zetten op datacaptatie via beeldherkenning.

De eerste stap van de datacaptatie was het capteren van beelden en data.

Een aantal methoden werden gebruikt:

Luchtfoto’s 15cm/pixel (augustus 2020, EuroSense)
- RGB beelden
- InfraRood beelden
- Digital Surface Model (DSM) o.b.v. stereobeelden
Digital Terrain Model (DTM) (LiDAR 40cm/pixel, 2014)

Gebouwen vectormodel (shapefile, GRB)

De tweede stap was de herkenning via machine learning.

Hiervoor werd een proefzone van 2x2km (40cm/pixel beelden Vlaanderen) bepaald waarbij er zowel een manuele (door jobstudenten) als een machine learning inventarisering gebeurde.

Tot slot werden de resultaten geanalyseerd:

Er werd gekeken naar attributen zoals locatie, diameter van de boomkruin en hoogte van de bomen
Verder werd de detectie van de bomen vergeleken
- vrijstaande bomen werden zeer goed geïdentificeerd (resultaat: 98.000 vrijstaande bomen)
- de identificatie van bosrijk gebied was moeilijk (oa door overlap van boomkruinen)
  - Er werden slechts 1.145 bomen geïdentificeerd in het Sterrenbos (27 ha) vs een stadnaard bomendichtheid: 13.500 à 54.000 bomen (500 à 2.000 bomen/ha)

De vervolgstappen bestaan uit de machine learning-data als basis te gebruiken voor een boominventaris binnen het kader van groenbeheer

dit kan dan verder verrijkt worden met extra attributen (bvb boomsoort, leeftijd, beheer, snoei etc.)

Hoe?

op het terrein door middel van ESRI-apps
door boomexperten StadLandSchap (provincie West-Vlaanderen)

VLOCA

VLOCA, de Vlaamse Open City Architectuur, is een initiatief van het Agentschap Binnenlands Bestuur van de Vlaamse Overheid. De hulp van VLOCA aan lokale besturen start bij het scherpstellen van duidelijke, verstaanbare use cases en loopt door tot de aanbestedingsfase van het project. VLOCA vormt op deze manier een duidelijke brug tussen de beleidsdoelstellingen van het lokale bestuur en de technische laag waarin de oplossingen beschreven en geïmplementeerd worden. We stellen de juiste vragen en verzamelen de noden en behoeften van alle stakeholders (lokale besturen, kenniscentra, bedrijven en burgerorganisaties). Door een gestructureerde aanpak en verwerking van deze informatie wordt de ontwikkeling van herbruikbare bouwblokken, standaarden en normen gestimuleerd die van Vlaanderen één grote interoperabele slimme regio kunnen maken. De opgedane kennis en ervaring wordt ontsloten via een kennishub waarop onder andere draaiboeken, architectuur componenten en modellen ter beschikking gesteld worden voor alle andere lokale besturen en stakeholders.

Brainstormsessie

Doel

Het doel van de brainstormsessie is het volgende:

Identificatie van de meerwaardecreatie
Inzicht in wat je nodig hebt om de meerwaardecreaties te realiseren
Beschrijven van mogelijkheden om de oplossing te verduurzamen
Opsommen van valkuilen en potentiële principes waaraan de oplossing moet voldoen

Oefening 1+2

Bij deze oefeningen stonden we stil bij de volgende vragen:

1) Waarom is groen inventarisering belangrijk? Laat ons uitgaan van ‘the worst case’: we doen het niet.. Wat zijn de gevolgen?

Voorbeeld: We kunnen geen rapportering doen naar Vlaamse overheid/EU (subsidies?)

2) Wat heb je nodig om de geïdentificeerde meerwaardecreaties uit oefening 1 te realiseren? Lijst de acties op

Voorbeeld:

-Doel: we willen kunnen rapporteren naar Vlaanderen. Wat heb je hiervoor precies nodig?

-Ik wil het aantal bomen in een bepaalde regio gedurende een bepaalde tijd visueel weergeven, deze vergelijken met een ijkpunt/objectief en een actieplan opmaken

Identificatie meerwaardecreatie	Toegepast
Zicht op evolutie kruinprojectie (in tijd, privaat/publiek, per wijk) -> evaluatie beleid + te nemen acties	Foto's identificatie van boomkruinen van 2 periodes met elkaar vergelijken (zorgen dat die idd vergelijkbaar zijn) en de 'delta' te capteren tov een objectief/target. En de verschillen te rapporteren op geografische voor actiebeleid (vanuit Europa mag het niet negatief evolueren)
implementeren en monitoring van 3-30-300 regel (= 30% kruinoppervlakte) = Natuurherstelwet (in oct 2023 goedgekeurd in EU)	Infraroodbeelden (zomer beelden) en LIDAR data
geen objectief zicht op werkvolume / kostprijs voor onderhoud (eigen beheer / uitbesteed)	foto's analyseren op basis van AI om type beplanting en oppervlaktes/ lopende meters automatisch te genereren
bestekken controleren voor onderhoud openbaar groen
Klimaat adaptatie gebeurt via bomen => daarom focus op bomentellingen
groenonderhoud ifv type bomen, struiken (snoeien ikv van kwetsbare zones broedseizoen vogels)
zicht op wijzigingen in het bomenbestand (uitval (extra bomen te planten), conditie (medisch ingrijpen..) - ifv beheer )	herkenning en signaliseren van wijzigingen in de detectie van bomenbestand
ineffici nt groenonderhoud (geen zicht op welke bomen waar staan)=> verkeerde plaatsen gestuurd (ook verkeerde prioritisatie)
De periodes waar onderhoud niet mag gebeuren (bvb wegens broedseizoen vogels) met waar heeft dit vooral impact op.
Beter inschatting van de kosten van groenonderhoud	Verschillende types vegetatie ; health status, ... karteren en op basis hiervan cijfers berekenen m.b.t. - status groen;- welke fractie heeft onderhoud nodig en wanneer (meerjarenplan opmaken)
Burgerparticipatie: Waar staan bomen in mijn buurt, welke boom kan ik helpen verzorgen	Welke bomen zijn kwetsbaar, waar staan ze
	orthofoto's en infrarood van meerdere periodes.
	Hoeveel groen is er in mijn gemeente/wijk om zo CO2 sequestratie in te schatten + rapportage eu
De gezondheid van het bomenbestand inkaart brengen (via orthofoto en infrarood) via vliegtuig of drone	orthofoto's en infrarood van meerdere periodes van zomer tot zomer (winter beelden zijn hierbij niet echt relevant)
trends kunnen uithalen (uniformiseren van inventarisatie en analyses)	In sommige gevallen ook Mobile mapping data nodig
de natuurherstelwet eist tegen 2030 geen achteruitgang van groen in de stad	Infraroodbeelden (zomer beelden)
NDVI index = proxy voor gezondheid van de bomen
effici nte handhaving gerooide bomen zonder vergunning	detectie wijziging bomenbestand op privaat domein, gekoppeld aan kapvergunningen
Correlaties detecteren (bijv impact op luchtkwaliteit)	data standaardiseren om data te kunnen linken (obv locatie?) en vergelijken. Toegankelijk maken van de data
een boom/struik op een bepaalde locatie blijkt telkens opnieuw dood te gaan (ongeschikte locatie / soort boom)	monitoring evolutie gezondheid (conditie) van bomen/struiken o.b.v. soort boom / locatie v/d boom via jaarlijkse foto analyses
Sociale discrepantie in een stad (sommigen hebben meer bomen/groen dan andere) => hoe kunnen we dit 'nivelleren'
Detectie van groene longen in verstedelijkt gebied en hun spreiding (tegen hittestress, verbetering leefkwaliteit)	Lokaliseren van bomen en groen op luchtfoto's
Open data (voor burgers te informeren): waar zijn de groene zones in de stad, al dan niet met speeltoestellen, hoe is deze ingericht...	uitzetten tov andere basiskaarten (vb GRB - gebouwen en wegen voor verharding)
	uitzetten tov eigen interne databronnen (vb speelpleinen)
Correlatie van evolutie bomenbestand met andere omgevingsfactoren vaststellen (bebouwing, verharding, luchtvervuiling, wateroverlast, al dan niet vergunde kap=>handhaving)	Detectie van bomen en volume/kruinen van de bomen met daarbij het opbouwen van tijdreeksen om evoluties in de tijd kunnen vaststellen + vergelijken met centrale of eigen databronnen
	verrijken met andere databronnen, bebouwing, lunchtkwaliteit, wateroverlast,...
invasieve (woeker)planten verdringen bomen/struiken	pro-actieve detectie van invasieve planten o.b.v. luchtbeelden
invasieve (woeker)planten verdringen bomen/struiken	dronebeelden (=hyperspectrale camera's, want normale 3 kleuren camera's zijn niet voldoende om dit te kunnen capteren)
Geen zicht op de verhardingsgraad binnen een AOI (Area of Interest)	Kost van graafwerken (in een verharde plaats is kostelijker dan berm bvb)
	Land cover classificatie kan helpen om de verhardingsgraad te inventariseren + monitoren en de impact van acties te begroten
	Kan eventueel gebruikt worden voor taxatie (=beloning bij ontharding)
ontharding ikv van vergunningsvoorwaarden analyseren -> handhaving	2 luchtfoto's analyseren voor en na
handhaving van voortuinen die 'verhard' werden in het verleden => binnen het jaar	ook 'winter' foto's mogelijk (zijn zelfs gemakkelijker omdat de bomen niet in de weg staan) => GIM : Belmap/perceel's kenmerken/verharding vanuit winterfoto's gedaan
doorlaatbare beton vs niet doorlaatbare beton
kunstgras vs echt gras <= via IR foto's

Oefening 3

Bij deze oefening keken we naar manieren om de voorgestelde oplossing duurzaam te implementeren:

Hoe kunnen we groen inventarisering duurzaam implementeren?

-Welke frequentie en accuratheid zijn hiervoor nodig?

-Hoe kunnen AI en ML bijdragen tot het verduurzamen van de oplossing?

-Welke expertise hebben we nodig?

-Hoe kunnen we de kosten delen?

-Zijn er applicaties die noodzakelijk zijn om de oplossing draaiende te houden?

=> zorgen dat de groen inventaris up to date gehouden wordt?

Verduurzamen oplossing
Expertise: - Groenbeleid/groenbeheer Datascience GIS, ML/AI => Frequentie is afhankelijk van welke monitoring frequentie nodig heeft
Beter 1 type opname dat voor vele toepassingen kan worden gebruikt dan meerdere opnames/beelden (kiostprijs drukken)
Frequentie: max. 1 x jaar, min 1x per legislatuur (6 jaar)
Kosten : Drone >> vliegtuig >> satelliet beelden
Datascience expertise
pro-actief om bij 'crisis' situatie te kunnen handelen
Data engineering (ETL + GIS) expertise
Kosten: groepsaankoop organiseren. Bv 1 vlucht voor hele regio/provincie (bvb Leiedal, Limburg met drone excl. Voeren, 2euros per inwoner per jaar)
foto's gezamenlijk aankopen (volume kortingen)
foto's hergebruiken voor verschillende algoritmes --> centraal overzicht op een "marktplaats" met samples en kostprijs "hergebruik" licentie
aankopen met intercommunales
Niet elk soort beeld is bruikbaar voor alle use cases
Kost delen: foto's zoveel mogelijk hergebruiken intern, algorithme zoveel mogelijk extern delen
financiering - uniformiseren van modellen zodat Vlaanderen/ provincie een pakket kan aanbieden waar lokale besturen kunnen op intekenen
Private spelers zijn misschien ook geinteresseerd zoals infrabel ed meer
Kosten delen: aanbieden als een service (voor de runningcost) (pay for use)
ML-algoritmes delen (documentatie rond welke output het algoritme levert: inhoudelijk + nauwkeurigheid
(+ scores per algoritme x beeldmateriaal door afnemers)
AWV
Federaal niveau ?
zeer kritisch evalueren welk type foto's (resolutie / type camera's) nodig zijn voor welk type analyse
Matrix usecase vs frequentie en accuraatheid
Exploitatie kosten: - hosting; - ML running cost; - support of ML expert; - onderhoud algoritmes
Samenwerking tussen instanties voor dezelfde use case => build once apply frequently van de algoritmes
Samenwerking over verschillende use case zodat kan voortgebouwd worden op basis code ML algoritme
een algoritme voor resolutie / beeld x kan niet zonder meer toegepast worden op resolutie / beeld y
Data storage delen (local/cloud): Storage as a Service => brondata (foto's, lidar etc van verschillende jaargangen), opgeleverde ruwe data (bomenbestand, groeninventaris...), afgeleide data(?)
beelden ook interessant voor manuele analyses bij besturen indien voldoende hoge kwaliteit/resolutie
Kosten voor Desktop GIS of Cloud applicatie delen (open source alternativen)
Ondersteuning/support delen voor Desktop GIS/Cloud applicaties

Oefening 4

Tot slot werden potentiële valkuilen geïdentificeerd en, op basis hiervan, formuleerden we principes waaraan de oplossing moet voldoen:

Voorbeeld:

•Self-service zonder goede training kan een risico vormen

•Afhankelijkheid van leverancier

•Interoperabiliteit van de oplossing

•Betrouwbaarheid, en dus ‘vertrouwen’ in de output en dashboard cijfers

•Stabiliteit, en dus ‘continuiteit’ van de metrieken in de rapporten en dashboards

Valkuilen	Principes
Kostprijs	via externe partij de analyse uitvoeren (ze moeten die zelf niet uitvoeren)
kleinere gemeentes hebben een beperkte kennis en weten ook niet altijd waar ze terecht kunnen (+hoge kostprijs)
Expectation Management : Scope van het MLaaS-platform deint uit richting BI/Analytics i.p.v. afleveren datasets, waardoor verwachtingen te hoog worden gesteld en er teveel debat gevoerd moet worden over hoe je de data wil inzetten en wat je ermee wil gaan doen.Inpsiratie via het platform kan wel, kant en klare analytics is heel at moeilijker gezien linken met andere (interne) bronnen.
Limieten van ML : niet alles kan, maar kan ook om bvb 'gaten' of 'anomalien'
Te breed gaan in functionaliteit In eerste instantie enkel MUST HAVES uitwerken = 'noden' van lokale besturen (direct toepasbaar lokaal met budget, capaciteit, direct resultaat kunnen opleveren)
VB : Invasieve Exoten : sommige lokale besturen zijn daar nog niet mee bezig, dus ze gaan daar niet direct iets mee gaan doen.
BAK Bodem AfdekkingsKaart (3/30/300 ?) = bomenbestand brengt niet in kaart, gewoon groen, bebouwd, => niet voldoende of we op vlak van groen gaan we vooruit of niet)
de marktplaats (community) valt stil - te weinig bekendheid / potentieel te laag = Marketing (via partner zoals Leiedal, ABB, bvb.)
kwaliteit van beelden (bijv bij bewolkt weer)
verwachtingen ML-algoritmes technisch tgo inhoudelijke experten niet op dezelfde lijn (bvb vertrouwen in de resultaten, documentatie en co-creatie)	transparantie over kwaliteit van de resultaten, ML-algoritme otwikkelingsstatus..., ondersteuning (interne) data scientist of duidelijke documentatie), standaardisatie van beelden en algoritmes
Om correct vergelijk mogelijk te maken in de tijd: - Zelfde type beelden - Zelfde periode - Zelfde Ai/ML toepassing
zelfs lentebeelden zijn niet vergelijkbaar met zomerbeelden (sommige bomen bloeien later of vroeger)
Standaardisatie van beeldmateriaal vanuit 'Vlaanderen' om vergelijking mogelijk te maken
Bij wie zit IP van ontwikkeld algorithme
Niet het juiste beeld met de juiste kwaliteit voor de use case
Security vereisten proces	IT security standaarden / principes toepassen
ML/AI blijft een model benadering => Geen 100% correctheid / volledigheid
continu teit van leveranciers te garanderen (stopzetten deelactiviteiten zoals opname beelden, ontwikkeling algoritmes, support...)	Transparantie, bedrijfsvoering (om bvb faillissementen of veranderende werkmethodes op tijd te capteren), gebruikte technieken, documentatie, kennisopbouw intern houden, centraliseren
Elk model is use case / beeld specifiek => verwachtingsbeheer
Ook input/validatie nodig om het model te trainen false negatives en false postiives)
Nauwkeurigheid voor handhaving => eerder een signaalfuncties om ter plaatse te controleren
Eerder een 'reactieve' bomenbeleid => is dat wel een direct toepasbaar use case ?
aantallen is moeilijker, eerder via oppervlakte van kruinen

Opname en Miro bord

Miro bord

Het Miro bord kan je consulteren via deze link.

Opname

De opname van deze sessie is te bekijken via deze link.

Volgende stappen

Wat na deze werkgroep?

Verwerking van de input van de brainstorm oefening.
Verder onderzoek en voorbereiding van de volgende thematische werkgroep.
Publicatie op de Kennishub

Feedback kan bezorgd worden aan laurien.renders@vlaanderen.be

Andere werkgroepen

Werkgroep	Type werkgroep	Datum	Tijd	Locatie
Thematische werkgroep 1	Data en informatie werkgroep	2024-03-14	9u-12u	Teams
Thematische werkgroep 2	Functionele werkgroep	2024-04-16	9u-12u	Teams
Thematische werkgroep 3	Technologie werkgroep	2024-05-15	13u-16u	Teams
Thematische werkgroep 4	Technologie werkgroep	2024-06-21	9u-12u	Teams

@@ Regel 267: / Regel 267: @@
 Voorbeeld:
-•Self-service zonder goede training kan 'gevaarlijk' zijn
+•Self-service zonder goede training kan een risico vormen
 •Afhankelijkheid van leverancier