Buscar en este blog y otros asociados

martes, 21 de diciembre de 2010

Slides and abstracts of the 2nd Annual European DDI Users Group Meeting


El Segundo Encuentro Europeo de Usuarios de DDI (EDDI10), que se celebra anualmente, tuvo lugar en SURFfoundation en Utrecht (Holanda) los días 8 y 9 de diciembre, con la participación de casi 70 personas de 13 países. Antes del encuentro también se impartieron cursos de DDI y SDMX, y un taller para desarrolladores de DDI. Tal como se anunció al final de la conferencia, el anfitrión de EDDI del próximo año será Swedish National Data Service (SND) en Gotemburgo. 

Las presentaciones y resúmenes del EDDI10 son de un alto interés y se pueden consultar en los siguientes enlaces:

Introduction

Wendy Thomas (MPC - Minnesota Population Center)

Arofan Gregory (ODaF - Open Data Foundation)

Peter Wittenburg (Max Planck Institute for Psycholinguistics, Nijmegen)

Searching and Locating

Wolfgang ZenkMöltgen, Brigitte Hausstein (both GESIS - Leibniz Institute for the Social Sciences), Jan Brase (TIB - German National Library of Science and Technology)

William Block (CISER - Cornell Institute for Social and Economic Research)

Johan Fihn, Olof Olsson, Iris Alfredsson, Hans Jørgen Marker (all SND - Swedish National Data Service)

Project Updates

Alerk Amin (CentERdata - Institute for Data Collection and Research)

 Christian Gerhards (Bielefeld University, Faculty of Sociology)

Metadata in the Data Production Process

Jeremy Iverson (Algenta Technologies)

Steven Vale (UNECE - United Nations Economic Commission for Europe)

DDI Software

Ørnulf Risnes (Nesstar)

Don McIntosh (STR - Space-Time Research) / presented by Arofan Gegory

Dan Smith (Algenta Technologies)

Reports and Updates on DDI activities

Meinhard Moschner (GESIS - Leibniz Institute for the Social Sciences), Taina Jääsekläinen (FSD - Finnish Social Science Data Archive), Joachim Wackerow (GESIS - Leibniz Institute for the Social Sciences)

Joachim Wackerow (GESIS - Leibniz Institute for the Social Sciences)

Stefan Kramer (CISER - Cornell Institute for Social and Economic Research)

From DDI 2 to DDI 3

Tito Castillo (Institute of Child Health, University College London)

Monika Linne, Alexander Mühlbauer, and Wolfgang Zenk-Möltgen (all GESIS - Leibniz Institute for the Social Sciences)

Data Collection

Samuel Spencer (ABS - Australian Bureau of Statistics)

Nadine Dulisch (GESIS - Leibniz Institute for the Social Sciences)

Current Status and Recent Events

William Block and Stefan Kramer (both Cornell Institute for Social and Economic Research)

Jeremy Iverson (Algenta Technologies)

Wendy Thomas, Arofan Gregory, and Joachim Wackerow (all Technical Implementation Committee, DDI Alliance)



domingo, 12 de diciembre de 2010

Nueva versión de SDMX

Exposición de las especificaciones técnicas de la versión 2.1 para su revisión pública.


Cinco años después del lanzamiento de las especificaciones técnicas de la versión 2.0 de SDMX se pone a revisión pública la versión 2.1. Esta nueva versión, preparada a través de una consulta exhaustiva a expertos y usuarios, tiene como objetivo general la mejora de la actual 2.0. La nueva especificación corrige algunos bugs, añade funcionalidades e incluye una alineación más fuerte de los formatos de datos y esquemas con el modelo de información. Este borrador está abierto a revisión pública hasta el 2 de febrero de 2011. Después de las aportaciones de la comunidad SDMX y una vez revisada, la versión 2.1 se presentará ante el Comité Técnico ISO 154 para su aprobación como norma. Debermos recordar que en la actualidad la versión 1.0 de SDMX tiene la certificación ISO / TS 17369.

Documentos de la versión 2.1: 

Otros materiales:

Envío de comentarios y observaciones: secretariat@sdmx.org

viernes, 10 de diciembre de 2010

Eurovoc Conference: Building block of the semantic web


EuroVoc es un tesauro multilingüe cuya función primera es el tratamiento de la información documental que generan las instituciones de la Unión Europea. Se trata de un tesauro multidisciplinario que cubre ámbitos suficientemente amplios para dar cabida no sólo a los aspectos comunitarios, sino también a las perspectivas nacionales, con un perceptible acento en la actividad parlamentaria. EuroVoc es un vocabulario controlado, que puede utilizarse fuera de las instituciones de la Unión Europe, en particular en el ámbito parlamentario.

El objetivo del tesauro es aportar a los servicios responsables de la gestión y de la difusión de la información un instrumento de indización coherente que les permita gestionar con eficacia sus fondos documentales y permitir a los usuarios efectuar búsquedas documentales utilizando un lenguaje controlado. Este tesauro se encuentra disponible en XML y recientemente también lo está en SKOS (ver la entrada ¿Qué es SKOS?).

La conferencia "Building block of the semantic web" se centró en el tesauro EUROVOC y otros vocabularios controlados multilingüe como herramientas de indexación para facilitar la interoperabilidad y el acceso a la información. Ya están disponibles las presentaciones de la Conferencia:

Day 1 - 18/11/2010 
Opening
09:30 - 10:30Reception and registration
10:30 - 11:10
Conference opening and welcomeWelcome address by Ms Reicherts, General Director of the Publications Office.
Inaugurative Speech by Prof. Giovanni Sartor, European University Institute.
LEGAL INFORMATICS AND LEGAL CONCEPTS

Session 1: What news from EuroVoc and the Publications Office?
11:15 - 11:45EUROVOC, A PATH TO THE SEMANTIC WEB
Christine Laaboudi-Spoiden, Publications Office
11:45 - 12:15Improve access to EU content through thesaurus matching
JERÔME EUZENAT (INRIA LIG) &  LAURENT BEGIN (MONDECA)
12:15 - 12:45COMMON ACCESS TO EU INFORMATION - THE CELLAR PROJECT PRESENTATION
Peter Schmitz, Publications Office
12:45 - 13:00Q&A from the audience
Session 2: Thesauri "Speed Dating" workshop  
14:00 - 16:30Open discussion in working groups.
Date 1:
European Training Thesaurus
Marc Willem, Cedefop, ThessaloniqueTESE (Thesaurus for Education Systems in Europe)Wim Vansteenkiste, Education, Audiovisual & Culture Executive Agency, Brussels
Date 2:
Unesco Thesaurus
Meron Ewketu, Unesco, Paris
Date 3:
Gemet - General Multilingual Environmental Thesaurus
Stefan Jensen, European Environment Agency, Copenhagen
Agrovoc – Food and Agriculture Organisation Thesaurus
Johannes Keizer, Food and Agriculture Organization, RomeInspire Feature Concept Dictionary
Cristiano Fugazza, European Commission Joint Research Centre, Ispra
Date 4:
ESCO - European Taxonomy of Skills, Competencies and Occupations
Henric Stjernkvist, European Commission, DG Employment, Brussels
Date 5:
EUROPEAN THESAURUS ON INTERNATIONAL RELATIONS AND AREA STUDIES
Axel Huckstorf, Stiftung Wissenschaft und Politik, Berlin)
Date 6:
UNBIS - the United Nations Thesaurus
Alexandra McLeod, Dag Hammarskjöld Library, United Nations, New York
16:30 -16:50Coffee break
16:50 - 17:15The ideal thesaurus ? WORKSHOP CONCLUSION 
17:15 - 17:45ISO 25964 - THE NEW STANDARD FOR THESAURI AND INTEROPERABILITY WITH OTHER VOCABULARIES
(Stella Dextre Clarke, Consultant and project leader of the ISO 25964 Working Group)
Day 2 - 19/11/2010 (Sessions 3 and 4 are parallel sessions)
Session 3: Toward the semantic web – Metadata and Interoperability 
09:00 - 09:30DEVELOPING AND USING MULTILINGUAL SUBJECT HEADINGS LINKED DATA: A TEL MULTILINGUAL SUBJECT ACCESS INITIATIVE
Patrice Landry, Swiss National Library
09:30 - 10:00MULTILINGUAL ACCESS TO ONLINE CONTENT - THE EUROPEANA EXPERIENCE
Vivien Petras, Humboldt-University Berlin
10:00 - 10:30THE VOCABULARY MAPPING FRAMEWORK AND ITS POTENTIAL FOR IMPROVING METADATA INTEROPERABILITY IN THE SEMANTIC WEB
Gordon Dunsire, Centre for Digital Library Research - University of Strathclyde, UK
10:30 - 10:40Q&A from the audience
10:40 - 10:55Coffee break
11:00 - 11:30ARCHAEOLOGY AND TERMINOLOGY
Ceri Binding, Hypermedia Research Unit, Faculty of Advanced Technology, University of Glamorgan UK
11:30 - 11:40Q&A from the audience

Session 4: Indexing legal information
09:00 - 09:30AUTOMATIC EUROVOC INDEXING OF PARLIAMENTARY TEXTS IN ALL OFFICIAL EU LANGUAGES
Ralf Steinberger, EC Joint Research Centre, Ispra
09:30 - 10:00AUTOMATIC EUROVOC INDEXING OF PARLIAMENTARY DOCUMENTATION - LIVE DEMONSTRATION
Victoria Fernández Mera Congreso de los Diputados, Spain
10:00 - 10:30EUROVOC AND PARLIAMENTARY DOCUMENTS: A SEMI-AUTOMATIC CLASSIFICATION EXPERIENCE AT THE ITALIAN CAMERA DEI DEPUTATI
Calogero Salamone, Biblioteca Camera dei Deputati, Roma, Italy
10:30 - 10:40Q&A from the audience
10:40 - 10:55Coffee break
11:00 - 11:30AUTOMATIC INDEXING WITH THE EUROVOC THESAURUS ENABLING CROSS-LINGUAL SEARCH
Frane Šarić, University of Zagreb & Marie-Francine Moens, Katholieke Universiteit Leuven
11:30 - 11:40Q&A from the audience

Closing session
 
11:50 - 12:20VOCABULAIRE JURIDIQUE MULTILINGUE COMPARÉ
Caroline Reichling, Court of Justice of the European Union
12:20 - 12:45Closing address by Ms Reicherts, General Director of the Publications Office.

lunes, 6 de diciembre de 2010

StatCamp en Roma

Con ocasión de la X Conferencia Nacional de Estadística, que se celebrará en Roma en el Palazzo dei Congressi, 15 hasta 16 dic, 2010, se está organizando un "StatCamp" sobre la evolución de la tecnología de la información en la elaboración, la comunicación y el intercambio de información estadística.

El StatCamp será un espacio abierto para el debate y adoptar los mismos principiosbásicos de BarCamp. StatCamp de la Décima Conferencia se celebrará el 16 de diciembre y se dividirá en dos sesiones:




  • Estadísticas, tecnología de la información y la innovación, desde 11,30 hasta 13,30
  • DataGov y el intercambio de datos, desde 14,00 hasta 16,00

Para saber más: Blog de Vincenzo Patruno

Open Government. 10 ideas para hacer tu Ayuntamiento abierto

La Red de Municipios Digitales de Castilla y León ha publicado la guía “Open Government. 10 ideas para hacer tu Ayuntamiento abierto”, que tiene como objetivo presentar diez medidas a los responsables políticos y organizativos de los Ayuntamientos que permitan que su Administración se acerque a través de las Nuevas Tecnologías al modelo conocido como Gobierno Abierto, consiguiendo un Ayuntamiento más participativo, colaborativo y transparente hacia los ciudadanos.

El Gobierno Abierto u “Open Government” define una nueva forma de comunicación permanente y transparente entre la Administración y los ciudadanos, bidireccional, mediante la que se consigue su participación efectiva en los procesos de decisión, colaboración y control de la Administración. Las Administraciones pueden aprovechar las oportunidades que brinda Internet, en especial la web 2.0, como herramienta para lograr esta comunicación con el ciudadano.

En base a estos tres ejes, -colaboración, transparencia y participación-, se han agrupado estas diez propuestas, que van desde hacer la web municipal más social, pasando por la apertura de datos públicos a través de Internet y la posterior reutilización de los datos para el desarrollo de nuevas aplicaciones, hasta fomentar la participación de los ciudadanos en los asuntos del Ayuntamiento mediante nuevas plataformas de colaboración.

Aplicando estas medidas, los Ayuntamientos lograrán establecer una verdadera conversación con los ciudadanos, con el objetivo de atender de la mejor forma sus necesidades, tomando decisiones basadas en sus preferencias y permitiendo la colaboración tanto de ciudadanos como de empleados públicos en la mejora de la provisión de los servicios públicos prestados, y comunicando sus decisiones y resultados de forma abierta y transparente. En definitiva, consiguiendo un Ayuntamiento más Abierto.

Para saber más:

Open Government. 10 ideas para hacer tu Ayuntamiento abierto (PDF - 9.813 kb)

sábado, 4 de diciembre de 2010

Nesstar Publisher es ahora gratuito


El Norwegian Social Science Data Services (NSD) ha anunciado la aparición de la versión 4.0 del software Nesstar para la publicación y análisis de datos en línea. A partir de esta versión, el componente Nesstar Publisher es un producto gratuito y puede descargarse desde el sitio web Nesstar.

También conocido como el editor de metadatos IHSN (International Household Survey Network). El editor es una herramienta popular para la documentación de microdatos de acuerdo al estándar DDI (Data Documentation Initiative).

Para obtener más información:

jueves, 2 de diciembre de 2010

La AEMET establece el acceso libre y gratuito a todos sus datos por medios electrónicos


La Agencia Estatal de Meteorología (AEMET) facilita de forma progresiva el acceso libre y gratuito a todos sus datos mediante vía electrónica desde el día 30 de noviembre de 2010.

AEMET adopta así una nueva política de datos que tiene en cuenta de este modo la importancia de la información meteorológica como elemento clave de apoyo a la sociedad y su papel dinamizador tanto de la I+D como de muchas actividades ligadas a la meteorología. Por otra parte, este nuevo enfoque está de acuerdo con las directrices europeas y españolas en materia de información medioambiental.

El acceso a la información gratuita se lleva a cabo por medios electrónicos. La página web incrementa de forma notable sus contenidos de datos de observación al tiempo que se pone en operación un servidor de ficheros  y en el que, en una primera fase, se tiene disponible lo siguiente:
  • Datos diezminutales de unas 250 estaciones de observación de las redes de superficie de AEMET.
  • Resúmenes diarios de más de 600 estaciones de observación de las redes de superficie de AEMET.
  • Datos horarios de radiación solar de la red de medida de AEMET.
  • Datos diarios de ozono total y sondeos semanales de ozono.
  • Datos diezminutales de las redes de radares y de detección de rayos a intervalos de quince minutos.
  • Salidas numéricas del modelo numérico de predicción HIRLAM-AEMET actualizadas cuatro veces al día (mas de 1000 campos por salida).
  • Series completas de resúmenes diarios y mensuales de unas 110 estaciones climatológicas seleccionadas con, al menos, 15 años de antigüedad.
  • Boletines codificados de observatorios españoles de intercambio internacional.

Por otra parte, a lo largo de 2011, se ampliarán los contenidos de los conjuntos de datos anteriores y se incorporarán nuevos datos y productos.

domingo, 21 de noviembre de 2010

Consulta pública sobre el borrador de Real Decreto que desarrolla la Ley de reutilización de la información del sector público

Los Ministerios de Industria, Turismo y Comercio y de Política Territorial y Administración Pública han abierto una consulta pública sobre el borrador de Real Decreto por el que se desarrolla la Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público.


De acuerdo con la Estrategia 2011-2015 del Plan Avanza 2, aprobada en Consejo de Ministros el pasado 16 de julio, el objetivo de dicha iniciativa normativa es el de detallar para el ámbito de la Administración General del Estado las disposiciones de la citada Ley 37/2007, promoviendo y facilitando al máximo la puesta a disposición de la información del sector público para su reutilización para fines tanto comerciales como no.

La consulta, abierta a la participación de cualquier persona interesada, con el fin de que puedan conocer los contenidos del borrador de Real Decreto y de realizar sus aportaciones al mismo.


Invitación a participar: Se pueden enviar comentarios hasta el 15 de diciembre de 2010 

Con el fin de que los interesados puedan conocer los contenidos del borrador de Real Decreto y de que puedan realizar sus aportaciones al mismo, se abre un período de consulta pública sobre el mismo.


lunes, 15 de noviembre de 2010

Modelo Neuchâtel para la gestión de clasificaciones, variables y otros conceptos relacionados

En 2004, el grupo de Neuchâtel publicó la versión 2.1 de su modelo conceptual para la gestión de clasificaciones estadísticas. El propósito principal de la obra fue tener un lenguaje y una percepción común de la estructura de las clasificaciones, los objetos que las componen, sus atributos y los vínculos entre ellos. Posteriormente en 2006, el modelo se extendió a variables y otros conceptos relacionados. El modelo incluye elementos, y sus atributos, tales como:

  • Las operaciones estadísticas, las familias de operaciones y las realización de una operación.
  • Las variables, los conceptos nominales y operacionales, la unidades de medidas.
  • Matrices, cubos y tablas
  • Población, marcos y muestras.

El objetivo de los documentos es ofrecer puntos de partida para las Oficinas Estadísticas con la finalidad de que dispongan de modelos básicos de metadatos. Asimismo, conjuntamente con la empresa alemana Run-Software se desarrolló una herramienta de libre acceso, conocida con el nombre Bridge, para la gestión de los objetos y atributos del modelo de Neuchâtel.


Oficinas de Estadísticas y personas miembros del grupo de Neuchâtel :

  • Statistics Denmark: Søren Netterstrøm (sne@dst.dk)
  • Statistics Netherlands: Ad Willeboordse (AWLE@cbs.nl)
  • Statistics Norway: Anne Gro Hustoft (anne.gro.hustoft@ssb.no) - Jenny Linnerud (jenny.linnerud@ssb.no)
  • Statistics Sweden: Birgitta Ehrenström, editor (birgitta.ehrenstrom@scb.se) - Klas Blomqvist Klas.Blomqvist@scb.se)
  • Swiss Federal Statistical Office: Claude Macchi (claude.macchi@bfs.admin.ch) - Dominique Held (dominique.held@bfs.admin.ch)
  • Run Software: Werkstatt Reinhard Karge (reinhard.karge@runsoftware.com)
  • US Bureau of Labor Statistics: Dan Gillman (Gillman.Daniel@bls.gov)


Para saber más:

jueves, 11 de noviembre de 2010

De los pocketbooks a la estadística en el móvil

Tradicionalmente en la estadística oficial se han publicado los denominados "pocketbooks" o libros de bolsillo, en los que en un formato manejable se incluían los principales datos referidos a un tema específico o se recopilaban las principales cifras sobre un determinado territorio. De hecho dentro de la producción editorial de Eurostat podemos encontrarnos con una serie de estos libros de bolsillo, y por ir más cerca en Canarias se difunde anualmente el Canarias en Cifras.

Sin embargo, con la llegada de las aplicaciones para móviles posiblemente se acerca el fin de este formato de publicación. De hecho el instituto de estadística holandés, Statistics Netherlands (CBS), se ha puesto manos a la obra  y ha difundido una aplicación para iPhone con esta filosofía. La aplicación se puede encontrar en CBS Statline en el iPhone App Store.


lunes, 8 de noviembre de 2010

270.000 conjuntos de datos abiertos en EE.UU.

Entrevista a Vivek Kundra, U.S. Chief Information Officer, en el New York Times.

Vivek Kundra es el Director de información de los Estados Unidos. Su trabajo es ayudar a dar forma a la utilización de la tecnología en el Gobierno y construir herramientas para ayudar al público a navegar por la increíble cantidad de datos e información disponibles. El pasado 5 de noviembre, el New York Times le realizó una entrevista muy interesante de la que extraigo unas cuántas preguntas:

¿Qué estás haciendo con data.gov?

Bueno, cuando comenzamos el sitio en mayo de 2009, había 47 conjuntos de datos a disposición del público. Hoy tenemos 274 mil series de datos disponibles. Estamos promoviendo la transparencia en todas las facetas del gobierno, y hacer que los datos estén disponibles es el primer paso. Estamos añadiendo cientos de datos de interés de los organismos públicos y en todos los aspectos de gobierno.

¿Y qué están haciendo las personas con estos conjuntos de datos?

Hemos visto algunas aplicaciones sorprendentes de estos conjuntos de datos. Una persona, por ejemplo, creó una aplicación para el iPhone, la CPSC Recalls, que utiliza información de la Consumer Product Safety Commission. Esta aplicación recopila todos los productos retirados del mercado en los Estados Unidos, y con ella un ciudadano puede utilizar la cámara en su teléfono móvil para buscar un producto en una tienda y ver si ha sido retirado del mercado o si existen alertas sobre el mismo.

¿Parece que el Gobierno y los ciudadanos están trabajando en conjunto con estos conjuntos de datos?

Por supuesto. Hemos pasado a un modelo de co-innovación, donde el pueblo estadounidense puede ayudar a crear valor de una forma que nunca habíamos podido hacer antes. El CPSC Recalls fue originalmente creado por un desarrollador al azar y luego, el Gobierno, creó una nueva versión de la aplicación y la liberó para la plataforma Android.

Leer artículo completo en el New York Times (inglés)

viernes, 5 de noviembre de 2010

El uso de widgets en la difusión de estadísticas

Vincenzo Patruno del Instituto Italiano de Estadística (ISTAT) presentó en la International Marketing and Output Database Conference (IMAODBC 2010) el uso de widgets para la difusión de la información estadística.

Los widgets son pequeñas piezas de código que pueden ser embebidas en una página web e interactuar con una aplicación, es decir, una base de datos. Una vez incorporadas dichas piezas de código, la información que proporcionan se actualiza automáticamente cada vez que la propia aplicación se actualiza.

Presentación de Vincenzo Patruno en IMAODBC 2010

En España, Xavier Badosa del Instituto de Estadística de Cataluña (Idescat) presentó en su momento (JECAS 2008) los interesantes trabajos que en el seno de ese Instituto vienen desarrollando en el uso de APIs y widgets para la difusión de estadísticas

Presentación de Xavier Badosa en las JECAS 2008


Ejemplos de uso:

Widget de indicadores al día de Cataluña

El código a embeber es el siguiente:

<!-- Giny indic Idescat -->
<script type="text/javascript" src="
http://api.idescat.cat/indicadors.js?p=lc/000000;e/a;w/250;c/ffffff;bc/719ee1&amp;lang=es"></script>
<noscript><a href="
http://www.idescat.cat/economia/inec?tc=1&amp;lang=es">Indicadores de coyuntura económica</a></noscript>
<!-- /Giny indic Idescat -->


Y el resultado de visualización es el siguiente:




Widget de consulta de datos poblacionales en Italia

El código a embeber es el siguiente:

<script type="text/javascript" src="http://www.vincenzopatruno.org/dir/net_migration.js"></script>

miércoles, 3 de noviembre de 2010

Tim Berners-Lee acerca de la futura Web: Open Data y Linked Data

Hace 20 años, Tim Berners-Lee inventó la World Wide Web. Para su próximo proyecto, está construyendo una web para datos enlazados y abiertos que pueda hacer con los números lo que la Web hizo con las palabras, las imágenes y el video: desbloquear nuestros datos y repensar la forma en que los usamos.

Aquí inserto dos pequeñas charlas de Tim Berners-Lee dentro del ciclo de conferencias TED (Technology, Entertainment, Design), en el que aborda dos cuestiones importantes: la apertura de datos (Open Data) y los datos enlazables (Linked Data).


La futura web



El año en que los datos de libre acceso se globalizaron



Para saber más:

jueves, 14 de octubre de 2010

Núcleo de Metadatos Documentales

El ISTAC presenta en las JECAS 2010 su núcleo de metadatos documentales de recursos de información estadística.
 

El Núcleo de Metadatos Documentales de los Recursos de Información Estadística del Instituto Canario de Estadística (ISTAC) establece el conjunto de metadatos que comparten todos los resultados estadísticos de una operación estadística, independientemente de su tipo o formato.

Definimos como operación estadística base al conjunto de tareas estadísticas que tienen como objetivo la obtención de resultados estadísticos inéditos y su posterior publicación. Por lo tanto, tales operaciones son las columnas sobre las que se sostiene el sistema de información estadística pública. El principal resultado de una operación estadística base es la matriz de microdatos estadísticos y a partir de los mismos, a través de métodos de agregación, se pueden  obtener otros resultados que denominamos macrodatos estadísticos. Estos macrodatos los podemos clasificar en:

  1. Matrices de macrodatos
  2. Cubos estadísticos
  3. Tablas estadísticas
Y a partir de ellos se obtienen representaciones visuales sintéticas, tales como gráficos o mapas. Asimismo, una publicación estadística se constituye por la agrupación, ordenación y análisis de diversos resultados estadísticos. Y una noticia estadística no es más que una información sintética surgida de una publicación estadística y que nace con vocación de comunicación generalista.
                                     
Definimos pues como recurso de información estadística tanto a los resultados estadísticos como a las publicaciones y noticias estadísticas. En definitiva, el núcleo establece el conjunto de metadatos documentales que comparten los siguientes recursos de información estadística:

Recursos estadísticos
Tipo
Tipo DCMI (1)
Código
DATASET
Dataset
DS
DATASET > matriz de datos
Dataset
DSM
DATASET > cubo
Dataset
DSC
DATASET > tabla
Dataset
DST
FIGURA
Image
F
FIGURA > gráfico
Image
FG
FIGURA > mapa
Image
FM
COLECCIÓN DE DATOS Y FIGURAS
Colecction
P
COLECCIÓN > datos detallados
Colecction
PDD
COLECCIÓN > análisis y descripción de datos
Colecction
PAD
NOTICIA
Collecction
N
NOTICIA > estadística
Collecction
NE


Recordemos que el Código de Buenas Prácticas de las Estadísticas Europeas en su principio número 15, sobre accesibilidad y claridad, establece que “Las estadísticas europeas deberían presentarse de forma clara y comprensible, difundirse de forma adecuada y conveniente y estar disponibles, asimismo se debería permitir el acceso a las mismas de forma imparcial, con metadatos y orientación de apoyo”.

Una definición utilizada con frecuencia nos dice que los metadatos son "datos sobre datos", en general un objeto que describe o dice algo sobre otro objeto de información. De manera formal podríamos decir que un metadato es un dato que se encarga de mantener un registro sobre el significado, contexto o propósito de un objeto informativo, con la pretensión de poder descubrir, entender, extraer y administrar dicho objeto.

Estándares de referencia


En la definición del núcleo de metadatos se han tenido en consideración los siguientes estándares:

  1. Dublin Core¸ como estándar genérico para la documentación de recursos, en su versión extendida de elementos refinados compuesta por 40 tipos de metadatos. 
  1. Data Documentation Initiative (DDI), tanto en su versión 2 como en su versión 3. 
  1. PC-Axis, en su versión 2008.

Los metadatos del núcleo


El núcleo de metadatos documentales de los recursos de información estadística del ISTAC lo componen 70 metadatos organizados en los siguientes bloques:

         Versiones
         Identificadores
         Idiomas         
         Clasificadores temáticos del contenido
         Descriptores de contenido
         Descriptores de clase de recurso
         Descriptores de producción de un recurso
         Descriptores de publicación de un recurso
         Descriptores de relaciones entre recursos
         Descriptores de propiedad intelectual
         Descriptores de interacción con los usuarios

Un ejemplo de uso: el buscador web

 

El uso más frecuentemente mencionado sobre metadatos es la refinación de consultas en buscadores. En ese sentido, el nuevo buscador de la página Web del ISTAC (actualmente en desarrollo) aprovecha el núcleo de metadatos para facilitar a los usuarios sus búsquedas.



Bibliografía básica de referencia







DATA INFORMATION SPECIALISTS COMMITTEE – UK (2009), Policy-making for Research Data in Repositories: A Guide.


INSTITUTO CANARIO DE ESTADÍSTICA (2009), Manual de metadatos PC-Axis.

INSTITUTO CANARIO DE ESTADÍSTICA (2009), Normas básicas de premigración de tablas a PC-Axis.