"Parsed text" is een vooraf gedefinieerde eigenschap. Deze eigenschap is van te voren gedefinieerd (ook bekend als een speciale eigenschap) en komt met extra beheersprivileges, maar kan worden gebruikt net als elk andere door de gebruiker gedefinieerde eigenschap.
D
Data volume gaat over de hoeveelheid data die verzameld wordt en gebruikt wordt. Grote hoeveelheden data stellen hun speciefieke uitdagingen naar bijvoorbeeld data opslag, distributie, snelheid van opvragen, ... Technieken als tussen-opslag zoals caching (bijvoorbeeld toegepast in het Word Wide Web) spelen daarbij een belangrijke rol. Heel belangrijk bij grote data volumes is het doel : is het voor analyse, voor real-time verwerking, voor simulatie, voor beleid, ... +
Data eigenschap. +
Wat is een data broker
Een data broker slaat geen data op (by default); het verzamelt informatie uit verschillende bronnen; verwerkt het om het te verrijken, te verbeteren of te analyseren; en kan de data in licentie geven aan andere Organisaties . Data brokers kunnen ook rechtstreeks een licentie voor de gegevens van een andere organisatie geven of de gegevens van een andere organisatie verwerken om betere resultaten te behalen. Gegevens worden doorgaans benaderd via een Application Programming Interface (API) en hebben vaak betrekking op abonnementsovereenkomsten. Gegevens worden doorgaans niet 'verkocht' (d.w.z. het eigendom ervan overgedragen), maar worden in licentie gegeven voor bepaald of beperkt gebruik. (Een data broker wordt ook wel een information broker, syndicated data broker of information product supplier genoemd.)
Een data broker is dus nodig om data te delen tussen verschillende rollen in het ecosysteem zoals data producent, consument, prosument, model producent, city administratie, ... waarbij deze rollen "verifieerbare data organizaties" zijn. Een Data Broker treedt dus op als een "middle man" tussen data producenten en consumenten.
Data Marketplace
Vaak vervult een Data Broker ook de rol van data marketplace. Deze monetariseert de informatie die het doorgeeft aan de hand van een aantal modellen.
Voorwaarden om data af te nemen van een data broker die fungeert als marktplaats zijn bv:
pay-per-use: gebruikers moeten betalen voor de gegevens die ze gebruiken
abonnement: gebruikers betalen een vast bedrag
geven en nemen: bebruikers kunnen de gegevens gratis gebruiken als ze ook gegevens aan de makelaar verstrekken.
Data Catalogus
Aangezien een data broker mogelijk een groot aantal gegevenstypen kan bedienen, moet er een methode zijn om dit door een klant doorzoekbaar te maken. Hiervoor is een datacatalogus nodig. Deze catalogus biedt gebruikers een gestructureerd overzicht van de informatie-elementen. Aangezien de gegevens doorgaans gestructureerd zijn en onderling gerelateerd zijn. Voorbeelden hiervan zijn luchtkwaliteitsgegevens en weergegevens. Voor beide is het van belang dat duidelijk is wanneer en voor welke locatie ze zijn geregistreerd. Deze catalogus wordt vaak de knowledge graph van de broker genoemd.
Naast de feitelijke gegevens bevat de knowledge graph ook gegevens die de gegevens beschrijven (bijv. Bron, eigenaar). Dit wordt metadata genoemd.
In het kader van VLOCA is de knowledge graph gebaseerd op de smart city domeinen
Data Access
Een data broker moet niet alleen de toegang van een user regelen, maar moet de toegang tot de gegevens die hij bedient beheren; de toegangsbeheer moet fijnmazig zijn: tot welke gegevenselementen (bv. luchtkwaliteit) een klant toegang heeft, maar ook eventueel zijn toegang beperken tot bepaalde geografische regio's.
Bovendien moet het beheren hoe de gegevens worden gebruikt (datasoevereiniteit). Een klant die de gegevens gratis ontvangt voor bijvoorbeeld veiligheidsredenen mag deze niet opslaan voor historische analyse.
Schaalbaarheid
Een data broker moet potentieel grote hoeveelheden data leveren aan users/clients. Gegevens die mogelijk afkomstig zijn van diverse, geografisch ver verwijderde bronnen. Een data broker moet daarom schaalbaar zijn door het ondersteunen van "federation": de data broker zal niet één instantie zijn, maar een gedistribueerde set van data broker, die naar behoefte kan worden geschaald.
Security
Toegangscontrole is slechts een onderdeel van het beveiligen van een data broker. Een Data broker moet ook ervoor zorgen dat de gegevens op een veilige manier worden overgedragen. Ook zijn de gegevens die via de gegevensmakelaar worden geïnjecteerd afkomstig zijn van een vertrouwde bron. Daarom heeft een data broker fijnmazige mechanismen nodig om te garanderen dat de data wordt aangeboden betrouwbaar is en wordt gecommuniceerd met vertrouwde partijen.
Een Data Cataloog bevat een overzicht van de bestaande data (in bijvoorbeeld databases) en biedt beschrijvingen (gebruik makende van metadata) van de natuur en status van de data, zoals de schema's, het volume, de definities, eigenschappen, annotaties, ... De data cataloog is dus een belangrijke tool om de data betekenis te geven. +
Opdeling excel tabbladen/sheets +
Data tabblad +
definitie kolommen in data tabblad +
Meta-data tabblad +
json metadata +
Data gedreven beleid rond circulariteit +
Data Enrichment
Onder data enrichment verstaan we een bepaalde databron verrijken met andere data die gelinkt of gerelateerd is aan deze data.
Bijvoorbeeld, een straatsegment kan verrijkt worden door:
op te gaan zoeken hoeveel winkels er langs deze straat liggen
welke buslijnen er actief zijn
wat het hoogteverschil is tussen het start en eind punt van het segment
etc... +
Voor een definitie van deze afkorting verwijzen we naar [1]
↑ https://en.wikipedia.org/wiki/Data_fusion +
Dit is de initiatiefpagina City of Things Data gedreven beleidsondersteuning.
Deze pagina beschrijft het initiatief volgens de definitie op de VLAIO website en linkt door naar relevante pagina's op de kennishub.
[1]
Overzicht City Of Things Initiatieven
Initiatiefnemer Gelinkte Initiatieven Domeinen City of Things 2022 VLAIO Citerra - City Environmental Regulations and Rights for Access DAKS 2.0 – Data in Kleine Steden Data gedreven beleidsondersteuning Slim Ruimtelijk Plannen Slim Vrachtwagenparkeren ThermAi REVOLT Energie Management Systeem – datagedreven optimalisering energieverbruik in steden EMS DOE Modderstroom Monitoring SHOK – Slimme Handel en events met Openbare Kasten SIncR - SustainableInsights for Cities & Retailers Welkomapp voor nieuwkomers
Initiatiefnemer: Stad Genk
Medebegunstigden: Stad Kortrijk, Intercommunale Leiedal en POLIS.
Steden streven erna om hun beleidsdoelstellingen te ondersteunen op basis van onderzoek, data en analyse (data gedreven beleid). Informatie over verplaatsingen: waar, wanneer en hoe (met welk middel) verplaatsen burgers zich, is essentieel om inzichten te verwerven over bereikbaarheid van handelskernen, over leefbaarheid en verkeersveiligheid in buurten en de transitie naar een multimodale duurzame mobiliteit.
Het gebruik van deze data stuit echter in vele gevallen op technische en juridische problemen, zodat de mogelijkheden onderbenut blijven. Het project wil in een eerste stap deze bestaande bottlenecks aanpakken en een technisch en juridisch sluitend model uitwerken voor het gebruik van data uit (ANPR) camera’s en telsystemen. Dit model, gebaseerd op open standaarden (VLOCA-OSLO conform) zal ter beschikking gesteld worden van de Vlaamse steden en Gemeenten.
In een volgende stap wordt de informatie die volgens dit model wordt verzameld samengelegd met andere databronnen (druktemetingen, bezettingsgraden openbaar vervoer, betaalinfo etc.) en geanalyseerd vanuit de behoeften voor ondersteuning van de verschillende beleidsdoelstellingen. De analyse, in samenspraak en co-creatie met belangengroepen moet leiden tot een aantal dashboards en (mini) applicaties die vervolgens gebruikt kunnen worden voor efficiënte beleidsondersteuning. Ook deze bouwstenen zullen ter beschikking gesteld worden van geïnteresseerde besturen.
↑ https://www.vlaio.be/nl/vlaio-netwerk/city-things-slimme-steden-en-gemeenten/city-things
Data kwaliteit refereert naar processen en componenten die ervoor zorgen dat de betrouwbaarheid van de data gegarandeerd is. Dit kan verwijzen naar :
Compleetheid van data : zijn de verplichte en optionele velden in de data structuren naar behoren ingevuld zodat een consistente interpretatie van de data mogelijk is.
Actualiteit van data : zijn de beschikbare waarden nog actueel ?
Consistentie van de data : welke processen kunnen ervoor zorgen dat er traceerbaarheid is van de data bij updates, vooral bij gelinkte, gedistribueerde datasets. Dit houdt ook in dat relevante meta data aanwezig dient te zijn om goede interpretatie van de data mogelijk te maken.
Zuiverheid van data : dit is typisch het gevolg van een aantal data verificatie stappen, waarin volgens bepaalde beslisregels bepaalde waarden worden geïdentificeerd als onbetrouwbaar en vervolgens alsdusdanig gevlagd of uit de datastroom verwijderd worden.
Het voldoen van data aan zekere data quality objectives die meestal worden uitgedrukt in de vorm van statistische indicatoren. Hierbij kan een vorm van calibratie aan referentiewaarden nodig zijn, zoals typisch bij IoT sensor data. In heel wat kennisdomeinen worden formele data quality objectives afgesproken, waarbij onderscheid kan gemaakt worden tussen verschillende doeleinden van de data (indicatief, informatief, quantitatief). Indien statistische indicatoren beschikbaar zijn die een quantificatie van de onzekerheid van sensor waarden weergeven, dan kan deze informatie gevoelig bijdragen aan de compleetheid van de data (zie hoger). +
Data management is gericht op het optimaal beheren en gebruiken van data in een organisatie.
Lees meer: https://en.wikipedia.org/wiki/Data_management +
Data protection verwijst naar de manieren waarop data privacy en vertrouwen beschermd worden. Kan data teruggetracet worden tot een individu ? +
Data Security verwijst naar de veiligheid van data. Hoe veilig wordt de data beheerd en opgeslagen ? Dit slaat niet enkel op de fysische veiligheid (bijvoorbeeld fysische toegangscontrole tot servers), maar ook naar de virtuele veiligheid (bijvoorbeeld IAM). Security speelt een belangrijke rol in het vermijden dat systemen gehacked worden en data lekt of gestolen wordt. +
Semantiek van data verwijst naar de betekenis van de data. Het is een belangrijk onderdeel van smart data om te weten welke data er beschikbaar is, en wat deze vertelt over de realiteit. Dit verwijst niet enkel naar beschrijving van data en variabelen, maar ook naar de betekenis ervan in het echte leven. Meestal wordt deze betekenis van de data beschreven door meta-data, die meereist met de data zelf of kan teruggevonden worden in bijvoorbeeld een data catalogus. +
In het Engels: "A Data Space is a virtual data integration concept defined as a set of participants and a set of relationships among them, where participants provide their data resources and computing services."
[1]
In het Nederlands: "Een data space is een virtueel data-integratieconcept dat wordt gedefinieerd als een reeks deelnemers en een reeks onderlinge relaties, waarbij deelnemers hun databronnen en computerservices leveren."
Een data space vormt dus een ruimte waarin data wordt uitgewisseld tussen verschillende actoren in een ecosysteem. Elke toepassing heeft zijn eigen data space, dus is opgebouwd uit de verschillende databronnen die nodig zijn om de toepassingen mogelijk te maken. Er is dus niet 1 data space per toepassingsdomein, maar een schier oneindig mogelijk aantal data spaces.
↑ https://www.gaia-x.eu/pdf/Gaia-X_Architecture_Document_2103.pdf +