In het vak van datamanagement is metadata (samen met Data Quality en Data Security) een van de basisfuncties. In simpele woorden, metadata zijn gegevens over gegevens. Metadata definiëren, beschrijven de context, de inhoud en de structuur van gegevensobjecten, zoals series, dossiers, documenten, foto's, databanken, rekenbladen of audio- en videobestanden, en hun beheer door de tijd heen.
Als bedrijf is het belangrijk hier goed bij stil te staan. Bij metadata beschrijf je de karakteristieken van bepaalde gegevens. Het zijn dus eigenlijk data over data. De metadata bij een bepaald document (de gegevens) kunnen bijvoorbeeld zijn: de auteur, de datum van schrijven, de uitgever, het aantal pagina's en de taal waarin de gegevens zijn opgesteld.
Het vastleggen van metadata wordt ook wel metadateren of definiëren genoemd. Het bewaren bij of koppelen van metadata aan de data waarop ze betrekking hebben, heeft als voordeel dat de data makkelijker gevonden kan worden. Zo kan men in een zoekmachine die gebruik maakt van metadata bijvoorbeeld direct zoeken naar documenten geschreven door een bepaalde auteur. Met full text-zoeken, dus zonder gebruik te maken van metadata, is dit moeilijker, omdat elk document waarin de naam van de auteur voorkomt wordt gevonden. Dit kunnen er veel meer zijn dan de documenten die daadwerkelijk door de persoon geschreven zijn.
Het nadeel van werken met metadata is dat metadata moeten worden toegevoegd aan alle gegevens (documenten). Soms is dit eenvoudig automatisch te doen (zoals het bepalen van het aantal pagina's), maar vaak vereist dit werk dat nog niet goed zonder menselijke interventie uit te voeren is, zoals het extraheren van de naam van de auteur uit een tekstdocument, of het toewijzen van bepaalde trefwoorden.
Als je actief bent in de wereld van datamanagement en metadata is het belangrijk de processen, begrippen en procedures binnen datamanagement goed te begrijpen.
Datakitchen helpt je daarbij. Wij geven een uitgebreide DAMA-DMBOK training, waarbij je je kennis en vaardigheden binnen het vak datamanagement nog verder ontwikkeld en professionaliseert.