Buscar en este blog y otros asociados

jueves, 14 de octubre de 2010

Núcleo de Metadatos Documentales

El ISTAC presenta en las JECAS 2010 su núcleo de metadatos documentales de recursos de información estadística.
 

El Núcleo de Metadatos Documentales de los Recursos de Información Estadística del Instituto Canario de Estadística (ISTAC) establece el conjunto de metadatos que comparten todos los resultados estadísticos de una operación estadística, independientemente de su tipo o formato.

Definimos como operación estadística base al conjunto de tareas estadísticas que tienen como objetivo la obtención de resultados estadísticos inéditos y su posterior publicación. Por lo tanto, tales operaciones son las columnas sobre las que se sostiene el sistema de información estadística pública. El principal resultado de una operación estadística base es la matriz de microdatos estadísticos y a partir de los mismos, a través de métodos de agregación, se pueden  obtener otros resultados que denominamos macrodatos estadísticos. Estos macrodatos los podemos clasificar en:

  1. Matrices de macrodatos
  2. Cubos estadísticos
  3. Tablas estadísticas
Y a partir de ellos se obtienen representaciones visuales sintéticas, tales como gráficos o mapas. Asimismo, una publicación estadística se constituye por la agrupación, ordenación y análisis de diversos resultados estadísticos. Y una noticia estadística no es más que una información sintética surgida de una publicación estadística y que nace con vocación de comunicación generalista.
                                     
Definimos pues como recurso de información estadística tanto a los resultados estadísticos como a las publicaciones y noticias estadísticas. En definitiva, el núcleo establece el conjunto de metadatos documentales que comparten los siguientes recursos de información estadística:

Recursos estadísticos
Tipo
Tipo DCMI (1)
Código
DATASET
Dataset
DS
DATASET > matriz de datos
Dataset
DSM
DATASET > cubo
Dataset
DSC
DATASET > tabla
Dataset
DST
FIGURA
Image
F
FIGURA > gráfico
Image
FG
FIGURA > mapa
Image
FM
COLECCIÓN DE DATOS Y FIGURAS
Colecction
P
COLECCIÓN > datos detallados
Colecction
PDD
COLECCIÓN > análisis y descripción de datos
Colecction
PAD
NOTICIA
Collecction
N
NOTICIA > estadística
Collecction
NE


Recordemos que el Código de Buenas Prácticas de las Estadísticas Europeas en su principio número 15, sobre accesibilidad y claridad, establece que “Las estadísticas europeas deberían presentarse de forma clara y comprensible, difundirse de forma adecuada y conveniente y estar disponibles, asimismo se debería permitir el acceso a las mismas de forma imparcial, con metadatos y orientación de apoyo”.

Una definición utilizada con frecuencia nos dice que los metadatos son "datos sobre datos", en general un objeto que describe o dice algo sobre otro objeto de información. De manera formal podríamos decir que un metadato es un dato que se encarga de mantener un registro sobre el significado, contexto o propósito de un objeto informativo, con la pretensión de poder descubrir, entender, extraer y administrar dicho objeto.

Estándares de referencia


En la definición del núcleo de metadatos se han tenido en consideración los siguientes estándares:

  1. Dublin Core¸ como estándar genérico para la documentación de recursos, en su versión extendida de elementos refinados compuesta por 40 tipos de metadatos. 
  1. Data Documentation Initiative (DDI), tanto en su versión 2 como en su versión 3. 
  1. PC-Axis, en su versión 2008.

Los metadatos del núcleo


El núcleo de metadatos documentales de los recursos de información estadística del ISTAC lo componen 70 metadatos organizados en los siguientes bloques:

         Versiones
         Identificadores
         Idiomas         
         Clasificadores temáticos del contenido
         Descriptores de contenido
         Descriptores de clase de recurso
         Descriptores de producción de un recurso
         Descriptores de publicación de un recurso
         Descriptores de relaciones entre recursos
         Descriptores de propiedad intelectual
         Descriptores de interacción con los usuarios

Un ejemplo de uso: el buscador web

 

El uso más frecuentemente mencionado sobre metadatos es la refinación de consultas en buscadores. En ese sentido, el nuevo buscador de la página Web del ISTAC (actualmente en desarrollo) aprovecha el núcleo de metadatos para facilitar a los usuarios sus búsquedas.



Bibliografía básica de referencia







DATA INFORMATION SPECIALISTS COMMITTEE – UK (2009), Policy-making for Research Data in Repositories: A Guide.


INSTITUTO CANARIO DE ESTADÍSTICA (2009), Manual de metadatos PC-Axis.

INSTITUTO CANARIO DE ESTADÍSTICA (2009), Normas básicas de premigración de tablas a PC-Axis.


lunes, 4 de octubre de 2010

¿Qué es el DATA AUDIT FRAMEWORK?

Cuatro pasos para la gestión eficiente de los datos.

Para administrar eficazmente los fondos de datos y aprovechar plenamente su potencial, una organización debe primero ser consciente de la ubicación, estado y valor de estos activos. En ese sentido el Data Audit Framewok (DAF) proporciona a las instituciones los instrumentos necesarios para identificar, localizar, describir y evaluar cómo se están administrando sus datos. 

El Data Audit Framewok en un proyecto liderado por HATII en la Universidad de Glasgow en colaboración con el Digital Curation Center, y ha sido desarrollado con la financiación de JISC.

Una auditoría de datos debe ser capaz de identificar la duplicación de esfuerzos y señalar las áreas que requieren inversiones adicionales con el objetivo final de permitir a una organización aprovechar al máximo todos sus recursos. También pondrá de relieve las deficiencias en la generación de  datos y en el archivo de los mismos; proponieno cambios en las políticas de gestión con la finalidad de disminuir los riesgos de pérdida o infrautilización. Asimismo, una organización que es conocedora de sus datos se pone en una buena posición para aumentar el valor de sus colecciones a través de su uso continuo. Por lo tanto, en términos generales, una auditoría de datos aporta tres ventajas principales:
  1. Facilita la priorización de recursos, mejorando la eficiencia de la organización;
  2. Aumenta la capacidad para gestionar los riesgos asociados a las pérdidas de datos y a su irrecuperabilidad;
  3. Revaloriza los datos, mejorando su acceso y reutilización. 
Ahora bien, las organizaciones necesitan orientaciones sobre qué información debe ser recopilada en una auditoría de datos, dónde puede encontrar la información y cómo podrían aprovechar tanto la información como los datos una vez que han sido recopilados. El DAF se ha desarrollado con estas necesidades en mente, abordando cinco preguntas básicas:
  1. ¿Qué datos existen en la actualidad?
  2. ¿Dónde están localizados esos datos?
  3. ¿Cómo han sido administrados hasta la fecha?
  4. ¿Cuáles se deben mantener a largo plazo?
  5. ¿Cuáles son las prácticas actuales que colocan esos datos en riesgo?
Para ello, el DAF aporta una metodología y una herramienta on-line para facilitar a los auditores recopilar esta información; ayudando a garantizar que los datos se conserven y permanezcan accesibles a largo plazo.  La metodología de trabajo se organiza en cuatro etapas:
  1. La primera etapa es la de planificación de la auditoría de datos.
  2. La segunda esta es la identificación y clasificación de las colecciones de datos.
  3. La tercera etapa investiga el ciclo de vida de generación de las colecciones de datos, identifcando puntos débiles en la producción y conservación de los mismos.
  4. La cuarta etapa sintentiza la información recopilada y realiza recomendaciones para mejorar la gestión de las colecciones de datos.
 
Las cuatro etapas del DAF

En definitiva, el DAF proporciona un método simple de obtención y utilización de información sobre la producción y conservación de datos; proporcionado una imagen clara de la organización general de los ficheros de datos, su estado de conservación actual, así como acerca de la sensibilización del personal responsable de la producción de datos sobre la conservación y reutilización de los mismos. Por lo tanto el DAF ofrece a las organizaciones un buen instrumento para mejorar la gestión de los datos existentes. 
 
Para saber más: