Guia de publicación de Datos Abiertos
Para publicar datos abiertos y que estos cumplan con los criterios que aseguran su apertura se deben cumplir con lo siguientes requerimientos.
Estructura
Los datos a publicar deben cumplir con los principios Tidy Data mencionados anteriormente. Este conjunto de reglas propuestas por Hadley Wickham ayudan a organizar los datos de manera clara, coherente y fácilmente manipulable.
Formatos
No todos los formatos en los que se publican los datos tienen el mismo nivel de apertura. La disponibilidad y accesibilidad de los datos varían según el formato utilizado. Algunos formatos son más abiertos y accesibles, lo que permite a los usuarios acceder, analizar y utilizar los datos de manera fácil y sin restricciones. Estos formatos abiertos suelen estar basados en estándares ampliamente aceptados y documentados, como CSV (valores separados por comas) o JSON (notación de objetos JavaScript).
Por otro lado, existen formatos más cerrados, que son propietarios y requieren licenciamiento o software especifico para su uso, lo que dificulta la extracción y el uso de los datos sin las herramientas adecuadas. Ejemplos de estos formatos incluyen archivos de bases de datos cerradas o archivos binarios propietarios.
Por lo tanto, la elección del formato en el que se publican los datos es crucial, ya que puede determinar el grado de apertura y reutilización de la información. Los formatos abiertos fomentan la transparencia, la colaboración y la innovación, ya que permiten que múltiples actores accedan y trabajen con los datos de manera más sencilla.
Los niveles de apertuda considerados adecuados se encuentran en la sección de Formatos Estándar para su consulta.
Nomenclatura
Para publicar datos abiertos, es igualmente importante considerar una nomenclatura común para mantener un mayor control sobre las versiones. El uso de una nomenclatura estándar y coherente facilita la identificación y el seguimiento de las diferentes versiones de los conjuntos de datos, lo que resulta fundamental para garantizar la integridad y la trazabilidad de la información.
El estándar propuesto por la Secretaria de Innovación y Gobierno Abierto se encuentra publicado en la sección de Estándar de Nomenclatura.
Codificación
Todos los recursos de datos, incluyendo los geográficos, deben publicarse utilizando la codificación UTF-8 de la W3C, con el fin de asegurar que los caracteres se representen correctamente y se eviten problemas de compatibilidad y pérdida de información.
La codificación UTF-8 (Unicode Transformation Format 8-bit) es un estándar ampliamente utilizado que permite representar un amplio rango de caracteres y símbolos de diferentes idiomas y sistemas de escritura. Al utilizar UTF-8, se garantiza que los datos publicados sean legibles y interpretables de manera consistente en diversos sistemas, aplicaciones y dispositivos.
Diccionario de Datos
Todos los conjuntos de datos publicados deben estar acompañados de un diccionario de Datos. Un diccionario de datos es una herramienta fundamental para garantizar la comprensión y la interpretación correcta de los datos por parte de los usuarios. Proporciona metadatos que describen los elementos clave del conjunto de datos, como los nombres de los campos, las descripciones de los atributos, los tipos de datos, las unidades de medida, los códigos y cualquier otra información relevante.
En la sección de Diccionario de Datos es posible encontrar la descripción y guía de elaboración de un diccionario de datos bajos los estándares de la Secretaría de Innovación y Gobierno Abierto.
Licenciamiento
Es indispensable que los datos abiertos sean publicados mediante una licencia abierta que permita su reutilización con cualquier tipo de fin, incluyendo los fines económicos. Se recomiendan licencias que permitan compartir y redistribuir el material en cualquier medio o formato, así como adaptar, remezclar y construir a partir del material, en tanto se cumpla con la atribución correspondiente, citando las fuentes e indicando si se han realizado cambios.
En la siguiente página se encuentran descritas las licencias consideradasd para la publicación de datos abiertos y sus respectivas guías de uso.
No Comments