Buscar en este blog y otros asociados

jueves, 9 de septiembre de 2010

Standard Code Lists Project de Eurostat

 

En Diciembre de 2009 el Consejo de Administración de Eurostat encarga a la unidad B6 de "Bases de datos de referencia y metadatos" la armonización de las listas de códigos utilizadas en el conjunto del Eurostat. A continuación se explican los antecedentes, las reglas y los procesos seguidos por dicha unidad en el mencionado trabajo de armonización.

¿Qué son las listas de códigos para fines estadísticos?

Las listas de códigos son metadatos estructurales asociados a los conceptos estadísticos utilizados en las tablas multidimensionales de la Web de Eurostat. En general estas listas se basan en las clasificaciones estadísticas oficiales, tales como NACE Rev. 2 y CIUO, pero también existen otras listas de códigos asociadas a conceptos tales como el sexo, la edad, el tiempo, etc. Actualmente existen alrededor de 500 listas de códigos en la base de datos Eurostat.

¿Por qué tienen que estar armonizadas las listas de códigos?

La gran mayoría de las listas de códigos utilizadas en las bases de datos de Eurostat, tanto en difusión como en producción, no están armonizadas en la actualidad. Esto significa que se utilizan a veces diferentes códigos para el mismo concepto estadístico (por ejemplo, para el concepto fabricación se utilizan los códigos "Dr", "B0200", "SE0_4" y "TOT_MANUF"  en cuatro bases de datos de producción diferentes, mientras que el código estándar para esta sección NACE es "D" en referencia a la industria).

Esta situación no es muy satisfactoria, tanto para los productores de datos como para los usuarios de los mismos , ya que implica realizar trabajos extra que suponen una fuente permanente de errores. Por ello la Unidad B6 de Eurostat, se ha embarcando en la elaboración, lanzamiento y gestión de listas de códigos estadísticos estandarizadas; el uso homogéneo de estas listas estandarizadas en todas las estadísticas y en todas las etapas del Ciclo de Vida de los Datos, facilita la administración de datos y su intercambio.

¿Cuáles son las normas utilizadas para armonizar las listas de códigos?

Los criterios utilizados por Eurostat para armonizar las listas de códigos son los siguientes:
  1. Se basan en las clasificaciones estadísticas oficiales o en el uso de estándares siempre que sea posible.
  2. Se utilizan sólo caracteres alfanuméricos, así como el "-" (guión) y el "_" (subrayado), con la finalidad de evitar los problemas relacionados con el uso de los códigos en  las aplicaciones de software. El guión "-" se utiliza para definir intervalos, y el subrayado "_" para la agregación de dos códigos.
  3. Para evitar problemas con los 'ceros' se utiliza un acrónimo como prefijo antes de los códigos numéricos.
  4. Para los agregados se insertan códigos adicionales en las listas estandarizadas siempre que éstos sean necesarios para la producción de datos y su difusión.
  5. Las listas de códigos deben ser directamente utilizables y cubrir la variedad de bases de datos de referencia.
¿Quién hace qué?

La unidad B6 de Eurostat elabora y mantiene las listas de códigos estandarizadas, basándose en la labor realizada por las unidades de producción y en estrecha colaboración con los administradores de los dominios de información estadística. Los códigos nuevos se envían a la unidad B6 por las unidades de producción y los administradores de dominios, para incluirlos en las revisiones regulares de las listas si la solicitud está justificada.

La unidad B6 difunde estas listas a través del servidor de metadatos de Eurostat, denominado RAMON, donde se publican clasificaciones, conceptos y definiciones, así como glosarios. Esto significa que las listas de códigos estandarizas también están disponibles para los usuarios externos. En el futuro, tras el desarrollo de nuevas aplicaciones en Eurostat, las listas de códigos estandarizadas se cargarán en su gestor de metadatos.

¿Cómo se deben utilizar estas listas de código estandarizadas?

Las listas armonizadas son o serán utilizadas en las Base de datos de referencia de Eurostat (NewCronos en la actualidad, y Eurobase en el futuro), así como en el entorno de difusión de estadísticas. Además los administradores de los dominios estadísticos deben utilizarlos, siempre que sea posible, en sus bases de datos de producción y en sus formatos de transmisión de datos. Incluso si a veces no es posible ninguna aplicación inmediata en el nivel de base de datos de producción, los administradores de dominio tienen que usarlos siempre que surja la oportunidad. La adopción de los códigos armonizados en la cadena de producción de datos permitirá reducir la necesidad de transcodification y el riesgo de errores.

Estos códigos armonizados podrían ampliarse también a los Estados miembros ya sea directamente o cada vez que éstos participan en los formatos de transmisión de datos definidos por Eurostat.

Para saber más:

No hay comentarios:

Publicar un comentario