Meta-data Management

La definizione e la gestione di meta-dati in un ambiente di calcolo distribuito tipo GRID si configura grosso-modo come il servizio DNS di Internet. Su Internet quando si usa il nome di un computer ,questo viene mandato a una rete di server DNS che provvedono a trasformare il nome nell'indirizzo IP del computer. Nel caso del Meta-data management, ogni file in rete ha un nome unico (come i computer) e quando viene richiesto un servizio apposito provvede a cercare il computer e il dispositivo fisico su cui il file e' memorizzato. Questa ricerca viene fatta usando dei meta-dati (cioe' dati che descrivono file). Come per il DNS il sistema e' basato su una serie di cataloghi distribuiti contenenti meta-dati. Sono possibili molte soluzioni e la piu' semplice potrebbe essere quella di avere ad ogni sito interessato . In questo caso la gestione comporterebbe che quando un file viene modificato, il catalogo locale e' aggiornato e viene inviato a tutti i siti un messaggio di aggiornamento. Tutti i siti provvedono a importare il catalogo locale e ad aggiornare il catalogo globale.
Quando un utente richiede un file, viene interrogato prima il catalogo locale e quindi quello globale e finalmente inviata una richiesta del file al computer interessato.

L'implementazione di un servizio di meta-dati e' semplificata dal fatto di avere dati di un solo formato (ad esempio solo database Objectivity) ma potrebbe estendersi alla gestione di dati di diverso formato. In questo caso i cataloghi oltre a contenere dati su filename, ID, dimensione, data di ultimo aggiornamento, etc contengono anche dati sul formato usato.In questo caso i meta dati contengono anche un meta-modello del database e tutto il database distribuito si configura come un Database virtuale che uno accede attraverso il servizio di gestione dei metadati che provvede all'integrazione dell'informazione e facilita la sua condivisione senza bisogno di creare filtri ad hoc per trasformare i dati da un formato all'altro.La creazione di sistemi di meta-data management a questo livello e' molto complessa ma ha ora su Internet una soluzione relativamente semplice con l'uso di XML. Infatti i documenti XML a differenza di quelli HTML contengono ,oltre ai dati, anche la loro descrizione (cioe' dei meta dati). Questo permette di trasformare il Web in un'unico database. Esso puo' essere usato come un formato in grado di rappresentare qualsiasi tipo di database. Una volta che il contenuto del database e' stato trasferito nel formato XML, possiamo gestire le query al database gestendole direttamente a livello di XML.


Giuseppe Zito

Last modified: