Data en informatie werkgroep: Machine Learning as a Service (MLaaS)
Tijdens de eerste thematische werkgroep worden de data en informatienoden van de reeds geïdentificeerde use cases in kaart gebracht. De Werkgroep Data en Informatie staat open voor deelname door de gehele quadruple helix. Vaste deelnemers zijn de leden van het VLOCA-trajectconsortium en stakeholders, die samen de data- en informatienoden in kaart brengen. De verzamelde inzichten worden vervolgens verwerkt om de IT-architectuur verder aan te vullen.
De eerste thematische werkgroep rond 'Groen' vond plaats op 14 maart 2024.
Context
Initiatief
De stad Roeselare beschikt reeds over verschillende machine learning algoritmes die data genereren op basis van fotomateriaal en is hiervoor in contact met verschillende partijen. Deze data wordt gebruikt in zowel operationele processen als bij het nemen van beleidsbeslissingen.
Naast het voeden van eerder traditionele databanken stellen ze die intern ook ter beschikking via GEO loketten, en dit op een automatische manier. Deze kennis en ervaring willen ze verder uitbouwen en de algoritmes en processen tegelijkertijd ter beschikking stellen voor ieder bestuur, gaande van het kleinste lokaal bestuur tot bovenlokale overheden als Vlaanderen. Het concept van “machine learning as a service” laat de gebruiker om gebruik te maken van de data en de algoritmes zonder kennis te moeten uitbouwen van de technische achtergrond. Het moet als het ware een “dummy proof” platform worden waarbij men op een éénvoudige manier kan kiezen uit een overzichtelijke catalogus en kunnen “inpluggen” voor de processen die men nuttig acht. Door deze ontzorging kunnen meer besturen stappen zetten richting een sterker data gestuurde beleidsvorming en –voering.
Met het streven naar het opschalen van bestaande machine learning processen, het uitrollen van nieuwe mogelijkheden en deze via een platform als een service ter beschikking te stellen van alle overheden willen ze niet alleen zorgen voor meer data op Vlaams niveau maar ook voor “massa productie” aan een betaalbare prijs.
Groen inventarisering is een van de toepassingen binnen het MLaaS-project. In het bestuursakkoord van Roeselare werd de doelstelling opgenomen om 100.000 extra bomen te planten tegen 2025. Hiervoor was het nodig om zicht te krijgen op het bestaande aantal bomen. Om dit zo efficiënt mogelijk aan te pakken, wenste men in te zetten op datacaptatie via beeldherkenning.
De eerste stap van de datacaptatie was het capteren van beelden en data.
Een aantal methoden werden gebruikt:
- Luchtfoto’s 15cm/pixel (augustus 2020, EuroSense)
- RGB beelden
- InfraRood beelden
- Digital Surface Model (DSM) o.b.v. stereobeelden
- Digital Terrain Model (DTM) (LiDAR 40cm/pixel, 2014)
- Gebouwen vectormodel (shapefile, GRB)
De tweede stap was de herkenning via machine learning.
Hiervoor werd een proefzone van 2x2km (40cm/pixel beelden Vlaanderen) bepaald waarbij er zowel een manuele (door jobstudenten) als een machine learning inventarisering gebeurde.
Tot slot werden de resultaten geanalyseerd:
- Er werd gekeken naar attributen zoals locatie, diameter van de boomkruin en hoogte van de bomen
- Verder werd de detectie van de bomen vergeleken
- vrijstaande bomen werden zeer goed geïdentificeerd (resultaat: 98.000 vrijstaande bomen)
- de identificatie van bosrijk gebied was moeilijk (oa door overlap van boomkruinen)
- Er werden slechts 1.145 bomen geïdentificeerd in het Sterrenbos (27 ha) vs een stadnaard bomendichtheid: 13.500 à 54.000 bomen (500 à 2.000 bomen/ha)
De vervolgstappen bestaan uit de machine learning-data als basis te gebruiken voor een boominventaris binnen het kader van groenbeheer
- dit kan dan verder verrijkt worden met extra attributen (bvb boomsoort, leeftijd, beheer, snoei etc.)
Hoe?
- op het terrein door middel van ESRI-apps
- door boomexperten StadLandSchap (provincie West-Vlaanderen)
VLOCA
VLOCA, de Vlaamse Open City Architectuur, is een initiatief van het Agentschap Binnenlands Bestuur van de Vlaamse Overheid. De hulp van VLOCA aan lokale besturen start bij het scherpstellen van duidelijke, verstaanbare use cases en loopt door tot de aanbestedingsfase van het project. VLOCA vormt op deze manier een duidelijke brug tussen de beleidsdoelstellingen van het lokale bestuur en de technische laag waarin de oplossingen beschreven en geïmplementeerd worden. We stellen de juiste vragen en verzamelen de noden en behoeften van alle stakeholders (lokale besturen, kenniscentra, bedrijven en burgerorganisaties). Door een gestructureerde aanpak en verwerking van deze informatie wordt de ontwikkeling van herbruikbare bouwblokken, standaarden en normen gestimuleerd die van Vlaanderen één grote interoperabele slimme regio kunnen maken. De opgedane kennis en ervaring wordt ontsloten via een kennishub waarop onder andere draaiboeken, architectuur componenten en modellen ter beschikking gesteld worden voor alle andere lokale besturen en stakeholders.
Brainstormsessie
Doel
Het doel van de brainstormsessie is het volgende:
- Identificatie van de meerwaardecreatie
- Inzicht in wat je nodig hebt om de meerwaardecreaties te realiseren
- Beschrijven van mogelijkheden om de oplossing te verduurzamen
- Opsommen van valkuilen en potentiële principes waaraan de oplossing moet voldoen
Oefening 1+2
Bij deze oefeningen stonden we stil bij de volgende vragen:
1) Waarom is groen inventarisering belangrijk? Laat ons uitgaan van ‘the worst case’: we doen het niet.. Wat zijn de gevolgen?
- Voorbeeld: We kunnen geen rapportering doen naar Vlaamse overheid/EU (subsidies?)
2) Wat heb je nodig om de geïdentificeerde meerwaardecreaties uit oefening 1 te realiseren? Lijst de acties op
- Voorbeeld:
-Doel: we willen kunnen rapporteren naar Vlaanderen. Wat heb je hiervoor precies nodig?
-Ik wil het aantal bomen in een bepaalde regio gedurende een bepaalde tijd visueel weergeven, deze vergelijken met een ijkpunt/objectief en een actieplan opmaken
Identificatie meerwaardecreatie | Toegepast |
Zicht op evolutie kruinprojectie (in tijd, privaat/publiek, per wijk) -> evaluatie beleid + te nemen acties | Foto's identificatie van boomkruinen van 2 periodes met elkaar vergelijken (zorgen dat die idd vergelijkbaar zijn) en de 'delta' te capteren tov een objectief/target. En de verschillen te rapporteren op geografische voor actiebeleid (vanuit Europa mag het niet negatief evolueren) |
implementeren en monitoring van 3-30-300 regel (= 30% kruinoppervlakte) = Natuurherstelwet (in oct 2023 goedgekeurd in EU) | Infraroodbeelden (zomer beelden) en LIDAR data |
geen objectief zicht op werkvolume / kostprijs voor onderhoud (eigen beheer / uitbesteed) | foto's analyseren op basis van AI om type beplanting en oppervlaktes/ lopende meters automatisch te genereren |
bestekken controleren voor onderhoud openbaar groen | |
Klimaat adaptatie gebeurt via bomen => daarom focus op bomentellingen | |
groenonderhoud ifv type bomen, struiken (snoeien ikv van kwetsbare zones broedseizoen vogels) | |
zicht op wijzigingen in het bomenbestand (uitval (extra bomen te planten), conditie (medisch ingrijpen..) - ifv beheer ) | herkenning en signaliseren van wijzigingen in de detectie van bomenbestand |
ineffici nt groenonderhoud (geen zicht op welke bomen waar staan)=> verkeerde plaatsen gestuurd (ook verkeerde prioritisatie) | |
De periodes waar onderhoud niet mag gebeuren (bvb wegens broedseizoen vogels) met waar heeft dit vooral impact op. | |
Beter inschatting van de kosten van groenonderhoud | Verschillende types vegetatie ; health status, ... karteren en op basis hiervan cijfers berekenen m.b.t. - status groen;- welke fractie heeft onderhoud nodig en wanneer (meerjarenplan opmaken) |
Burgerparticipatie: Waar staan bomen in mijn buurt, welke boom kan ik helpen verzorgen | Welke bomen zijn kwetsbaar, waar staan ze |
orthofoto's en infrarood van meerdere periodes. | |
Hoeveel groen is er in mijn gemeente/wijk om zo CO2 sequestratie in te schatten + rapportage eu | |
De gezondheid van het bomenbestand inkaart brengen (via orthofoto en infrarood) via vliegtuig of drone | orthofoto's en infrarood van meerdere periodes van zomer tot zomer (winter beelden zijn hierbij niet echt relevant) |
trends kunnen uithalen (uniformiseren van inventarisatie en analyses) | In sommige gevallen ook Mobile mapping data nodig |
de natuurherstelwet eist tegen 2030 geen achteruitgang van groen in de stad | Infraroodbeelden (zomer beelden) |
NDVI index = proxy voor gezondheid van de bomen | |
effici nte handhaving gerooide bomen zonder vergunning | detectie wijziging bomenbestand op privaat domein, gekoppeld aan kapvergunningen |
Correlaties detecteren (bijv impact op luchtkwaliteit) | data standaardiseren om data te kunnen linken (obv locatie?) en vergelijken. Toegankelijk maken van de data |
een boom/struik op een bepaalde locatie blijkt telkens opnieuw dood te gaan (ongeschikte locatie / soort boom) | monitoring evolutie gezondheid (conditie) van bomen/struiken o.b.v. soort boom / locatie v/d boom via jaarlijkse foto analyses |
Sociale discrepantie in een stad (sommigen hebben meer bomen/groen dan andere) => hoe kunnen we dit 'nivelleren' | |
Detectie van groene longen in verstedelijkt gebied en hun spreiding (tegen hittestress, verbetering leefkwaliteit) | Lokaliseren van bomen en groen op luchtfoto's |
Open data (voor burgers te informeren): waar zijn de groene zones in de stad, al dan niet met speeltoestellen, hoe is deze ingericht... | uitzetten tov andere basiskaarten (vb GRB - gebouwen en wegen voor verharding) |
uitzetten tov eigen interne databronnen (vb speelpleinen) | |
Correlatie van evolutie bomenbestand met andere omgevingsfactoren vaststellen (bebouwing, verharding, luchtvervuiling, wateroverlast, al dan niet vergunde kap=>handhaving) | Detectie van bomen en volume/kruinen van de bomen met daarbij het opbouwen van tijdreeksen om evoluties in de tijd kunnen vaststellen + vergelijken met centrale of eigen databronnen |
verrijken met andere databronnen, bebouwing, lunchtkwaliteit, wateroverlast,... | |
invasieve (woeker)planten verdringen bomen/struiken | pro-actieve detectie van invasieve planten o.b.v. luchtbeelden |
dronebeelden (=hyperspectrale camera's, want normale 3 kleuren camera's zijn niet voldoende om dit te kunnen capteren) | |
Geen zicht op de verhardingsgraad binnen een AOI (Area of Interest) | Kost van graafwerken (in een verharde plaats is kostelijker dan berm bvb) |
Land cover classificatie kan helpen om de verhardingsgraad te inventariseren + monitoren en de impact van acties te begroten | |
Kan eventueel gebruikt worden voor taxatie (=beloning bij ontharding) | |
ontharding ikv van vergunningsvoorwaarden analyseren -> handhaving | 2 luchtfoto's analyseren voor en na |
handhaving van voortuinen die 'verhard' werden in het verleden => binnen het jaar | ook 'winter' foto's mogelijk (zijn zelfs gemakkelijker omdat de bomen niet in de weg staan) => GIM : Belmap/perceel's kenmerken/verharding vanuit winterfoto's gedaan |
doorlaatbare beton vs niet doorlaatbare beton | |
kunstgras vs echt gras <= via IR foto's |
Oefening 3
Bij deze oefening keken we naar manieren om de voorgestelde oplossing duurzaam te implementeren:
Hoe kunnen we groen inventarisering duurzaam implementeren?
-Welke frequentie en accuratheid zijn hiervoor nodig?
-Hoe kunnen AI en ML bijdragen tot het verduurzamen van de oplossing?
-Welke expertise hebben we nodig?
-Hoe kunnen we de kosten delen?
-Zijn er applicaties die noodzakelijk zijn om de oplossing draaiende te houden?
=> zorgen dat de groen inventaris up to date gehouden wordt?
Verduurzamen oplossing |
Expertise: - Groenbeleid/groenbeheer Datascience GIS, ML/AI => Frequentie is afhankelijk van welke monitoring frequentie nodig heeft |
Beter 1 type opname dat voor vele toepassingen kan worden gebruikt dan meerdere opnames/beelden (kiostprijs drukken) |
Frequentie: max. 1 x jaar, min 1x per legislatuur (6 jaar) |
Kosten : Drone >> vliegtuig >> satelliet beelden |
Datascience expertise |
pro-actief om bij 'crisis' situatie te kunnen handelen |
Data engineering (ETL + GIS) expertise |
Kosten: groepsaankoop organiseren. Bv 1 vlucht voor hele regio/provincie (bvb Leiedal, Limburg met drone excl. Voeren, 2euros per inwoner per jaar) |
foto's gezamenlijk aankopen (volume kortingen) |
foto's hergebruiken voor verschillende algoritmes --> centraal overzicht op een "marktplaats" met samples en kostprijs "hergebruik" licentie |
aankopen met intercommunales |
Niet elk soort beeld is bruikbaar voor alle use cases |
Kost delen: foto's zoveel mogelijk hergebruiken intern, algorithme zoveel mogelijk extern delen |
financiering - uniformiseren van modellen zodat Vlaanderen/ provincie een pakket kan aanbieden waar lokale besturen kunnen op intekenen |
Private spelers zijn misschien ook geinteresseerd zoals infrabel ed meer |
Kosten delen: aanbieden als een service (voor de runningcost) (pay for use) |
ML-algoritmes delen (documentatie rond welke output het algoritme levert: inhoudelijk + nauwkeurigheid |
(+ scores per algoritme x beeldmateriaal door afnemers) |
AWV |
Federaal niveau ? |
zeer kritisch evalueren welk type foto's (resolutie / type camera's) nodig zijn voor welk type analyse |
Matrix usecase vs frequentie en accuraatheid |
Exploitatie kosten: - hosting; - ML running cost; - support of ML expert; - onderhoud algoritmes |
Samenwerking tussen instanties voor dezelfde use case => build once apply frequently van de algoritmes |
Samenwerking over verschillende use case zodat kan voortgebouwd worden op basis code ML algoritme |
een algoritme voor resolutie / beeld x kan niet zonder meer toegepast worden op resolutie / beeld y |
Data storage delen (local/cloud): Storage as a Service => brondata (foto's, lidar etc van verschillende jaargangen), opgeleverde ruwe data (bomenbestand, groeninventaris...), afgeleide data(?) |
beelden ook interessant voor manuele analyses bij besturen indien voldoende hoge kwaliteit/resolutie |
Kosten voor Desktop GIS of Cloud applicatie delen (open source alternativen) |
Ondersteuning/support delen voor Desktop GIS/Cloud applicaties |
Oefening 4
Tot slot werden potentiële valkuilen geïdentificeerd en, op basis hiervan, formuleerden we principes waaraan de oplossing moet voldoen:
Voorbeeld:
•Self-service zonder goede training kan 'gevaarlijk' zijn
•Afhankelijkheid van leverancier
•Interoperabiliteit van de oplossing
•Betrouwbaarheid, en dus ‘vertrouwen’ in de output en dashboard cijfers
•Stabiliteit, en dus ‘continuiteit’ van de metrieken in de rapporten en dashboards
Valkuilen | Principes |
Kostprijs | via externe partij de analyse uitvoeren (ze moeten die zelf niet uitvoeren) |
kleinere gemeentes hebben een beperkte kennis en weten ook niet altijd waar ze terecht kunnen (+hoge kostprijs) | |
Expectation Management : Scope van het MLaaS-platform deint uit richting BI/Analytics i.p.v. afleveren datasets, waardoor verwachtingen te hoog worden gesteld en er teveel debat gevoerd moet worden over hoe je de data wil inzetten en wat je ermee wil gaan doen.Inpsiratie via het platform kan wel, kant en klare analytics is heel at moeilijker gezien linken met andere (interne) bronnen. | |
Limieten van ML : niet alles kan, maar kan ook om bvb 'gaten' of 'anomalien' | |
Te breed gaan in functionaliteit In eerste instantie enkel MUST HAVES uitwerken = 'noden' van lokale besturen (direct toepasbaar lokaal met budget, capaciteit, direct resultaat kunnen opleveren) |
|
VB : Invasieve Exoten : sommige lokale besturen zijn daar nog niet mee bezig, dus ze gaan daar niet direct iets mee gaan doen. | |
BAK Bodem AfdekkingsKaart (3/30/300 ?) = bomenbestand brengt niet in kaart, gewoon groen, bebouwd, => niet voldoende of we op vlak van groen gaan we vooruit of niet) |
|
de marktplaats (community) valt stil - te weinig bekendheid / potentieel te laag = Marketing (via partner zoals Leiedal, ABB, bvb.) | |
kwaliteit van beelden (bijv bij bewolkt weer) | |
verwachtingen ML-algoritmes technisch tgo inhoudelijke experten niet op dezelfde lijn (bvb vertrouwen in de resultaten, documentatie en co-creatie) | transparantie over kwaliteit van de resultaten, ML-algoritme otwikkelingsstatus..., ondersteuning (interne) data scientist of duidelijke documentatie), standaardisatie van beelden en algoritmes |
Om correct vergelijk mogelijk te maken in de tijd: - Zelfde type beelden - Zelfde periode - Zelfde Ai/ML toepassing |
|
zelfs lentebeelden zijn niet vergelijkbaar met zomerbeelden (sommige bomen bloeien later of vroeger) | |
Standaardisatie van beeldmateriaal vanuit 'Vlaanderen' om vergelijking mogelijk te maken | |
Bij wie zit IP van ontwikkeld algorithme | |
Niet het juiste beeld met de juiste kwaliteit voor de use case | |
Security vereisten proces | IT security standaarden / principes toepassen |
ML/AI blijft een model benadering => Geen 100% correctheid / volledigheid | |
continu teit van leveranciers te garanderen (stopzetten deelactiviteiten zoals opname beelden, ontwikkeling algoritmes, support...) | Transparantie, bedrijfsvoering (om bvb faillissementen of veranderende werkmethodes op tijd te capteren), gebruikte technieken, documentatie, kennisopbouw intern houden, centraliseren |
Elk model is use case / beeld specifiek => verwachtingsbeheer | |
Ook input/validatie nodig om het model te trainen false negatives en false postiives) | |
Nauwkeurigheid voor handhaving => eerder een signaalfuncties om ter plaatse te controleren | |
Eerder een 'reactieve' bomenbeleid => is dat wel een direct toepasbaar use case ? | |
aantallen is moeilijker, eerder via oppervlakte van kruinen |
Opname en Miro bord
Miro bord
Het Miro bord kan je consulteren via deze link.
Opname
De opname van deze sessie is te bekijken via deze link.
Volgende stappen
Wat na deze werkgroep?
- Verwerking van de input van de brainstorm oefening.
- Verder onderzoek en voorbereiding van de volgende thematische werkgroep.
- Publicatie op de Kennishub
Feedback kan bezorgd worden aan laurien.renders@vlaanderen.be
Andere werkgroepen
Werkgroep | Type werkgroep | Datum | Tijd | Locatie |
---|---|---|---|---|
Thematische werkgroep 1 | Data en informatie werkgroep | 2024-03-14 | 9u-12u | Teams |
Thematische werkgroep 2 | Technologie werkgroep | 2024-04-16 | 9u-12u | Teams |
Thematische werkgroep 3 | Technologie werkgroep | 2024-05-15 | 13u-16u | Teams |