Skip to main content

Estándar de Nomenclatura

Nomenclatura de Conjuntos de Datos

La nomenclatura en cuanto a la recolección y procesamiento de datos se refiere al nombre dado a los archivos que componen el conjunto de datos en cuestión. Con el fin de facilitar el entendimiento y uso de los mismos se proponen guías estándar para el nombramiento de los datos. Siguiendo las convenciones y reglas propuestas por IBM corporation (IBM, 2021). Se propone la siguiente estructura.

📁 prefijo nombre-dataset sufijo periodicidad
Prefijo

Al momento de guardar un archivo, el primer valor del prefijo debe ser un carácter alfabético (a-z) sin caracteres especiales.

  • sdhis-acceso-informacion-publica.csv: Versión completa del recurso.
Nombre

Los valores siguientes deben ser caracteres alfabéticos, numéricos (0 - 9), un guión (-) o los caracteres especiales $, #, @.

  • sdhis-acceso-informacion-publica.csv: Versión completa del recurso.
Sufijo

En en el caso de fragmentación del archivo de manera temporal o espacial

  • sdhis-acceso-informacion-publica-2014.csv: Versión fragmentada del recurso en el año 2014.
  • sdhis-acceso-informacion-publica-052014.csv: Versión fragmentada del recurso en mayo de 2014.
  • sdhis-acceso-informacion-publica-25052014.csv: Versión fragmentada del 25 de mayo de 2014.
Periodicidad

id valor
“a” Anual
“0” Multianual > 10 años
“1” Cada decada
“2” a “9” De cada 2 a 9 años
“b” Bi anual (cada semestre)
“t” Trimestral
“m” Mensual
“s” Semanal
“d” Diario
“o” Otro
"n" No periódico
  • sdhis-acceso-informacion-publica-m.csv: Versión del recurso completa actualizada mensualmente
Resumen de consideraciones a tomar para el nombramiento de bases de datos
  • Usar palabras siempre en minúsculas.
  • No usar artículos ni preposiciones.
  • Usar únicamente letras y números ASCII, siempre en minúsculas, comprendidos en el rango "a-z" y “0-9”.
  • Separar las palabras con guión medio "-".