Compartir datos

Compartí tus datos

Podés hacer disponibles tus conjuntos de datos de biodiversidad a través de la plataforma IPT (Integrated Publishing Toolkit). Cada institución adherida al Sistema Nacional de Datos Biológicos (SNDB) puede contar con más de un usuario en la plataforma.

El SNDB brinda apoyo a las instituciones proveedoras de datos para un proceso de publicación autónomo y con calidad. La revisión y curación de los datos es responsabilidad de cada entidad.

Solicitá tu usuario en el IPT.

Estandarizá tu conjunto de datos

Verificá y ajustá la estructura original de tus datos siguiendo el estándar Darwin Core.

Este trabajo puede incluir procesamiento adicional, como la edición y configuración del contenido del conjunto de datos. De esta forma, podrá ser interpretado y procesado por la herramienta de publicación IPT.

Durante este proceso, podés emplear alguno de los recursos disponibles en GBIF y la wiki de SIB Colombia.


El estándar Darwin Core (DwC)

Darwin Core es el estándar diseñado por Biodiversity Information Standards TDWG, adoptado por el Sistema Nacional de Datos Biológicos. Facilita el intercambio de información de registros de biodiversidad proveyendo definiciones de referencia, ejemplos y comentarios.

Incluye más de 203 elementos que facilitan la estandarización semántica, la sintaxis de los contenidos y el intercambio de datos. En otros contextos, estos elementos o términos básicos pueden entenderse como “campos”, “atributos”, “conceptos” o simplemente “encabezados”. Este conjunto de términos abarca diferentes categorías como: datos del evento, distribución, información taxonómica, entre otras.

Permite publicar datos contenidos en bases de datos, ya sea en hojas de cálculo o en archivos de texto (.cvs).


Alcance

Mediante el estándar DwC es posible documentar información biológica asociada a diferentes tipos de estudios. Actualmente se puede estructurar y disponer datos primarios de tres tipos:


  • Registros biológicos (occurrence): datos de especímenes a partir de observaciones, colectas o muestras tomadas en campo.
  • Listas de especies (checklist): compilación de una lista de especies únicas dentro de un conjunto de datos. Pueden tener un alcance temático, taxonómico, regional o una combinación de ellas. El conjunto de datos no debe tener nombres de taxones repetidos. Aunque se habla de “especies” es posible tener listas de taxones determinados a diferentes niveles taxonómicos.
  • Eventos de muestreo (sample based data): datos producto de investigaciones ambientales, ecológicas o sobre recursos naturales (programas de monitoreo). Estos datos son generalmente cuantitativos, controlados y siguen ciertos protocolos que permiten detectar cambios y tendencias en las poblaciones. A su vez, pueden ser comparables o medibles a través del tiempo dependiendo del objetivo del muestreo.

Implementación del estándar

La cantidad de información que puede ser documentada al implementar el estándar, puede ser abrumadora. Usalo de acuerdo a tus necesidades.

Algunas cuestiones clave:


  • Revisá el listado de términos de uso establecido por el SNDB.
  • A partir de tu conjunto de datos original reconocé cada uno de los atributos que deseas estructurar en DwC.
  • Identificá las grandes categorías que abarca el estándar y establecé dónde es posible acomodar los datos que deseás documentar.
  • Respetá la grafía exacta (sin espacios) para que no se genere ningún inconveniente al momento del mapeo en el IPT.
  • Tené en cuenta que ciertos campos se encuentran con terminología regulada (por ejemplo basisOfRecord). Si no respetás la terminología, el campo no se mapeará y por ende no se publicará.

Escribinos para recibir asesoramiento.

Calidad de datos

Los datos de calidad pueden ser reutilizados e influir en la toma de decisiones. Tenelo en cuenta a lo largo de todo el proceso de investigación.


Ciclo de la calidad de datos



Planificación

La Ley 26.899 de Repositorios Digitales Institucionales de Acceso Abierto exige la elaboración de un Plan de Gestión de Datos. La autoridad de aplicación de dicha ley es el Sistema Nacional de Repositorios Digitales (SNRD).

El Plan debe brindar un análisis de los principales elementos de la política de gestión de datos de la institución. Es decir, la política utilizada por los investigadores sobre los conjuntos de datos generados durante cada proyecto de investigación.

Asimismo, debe pretender la correcta descripción, difusión y accesibilidad de los conjuntos de datos.


Recolección de datos y documentación

Comprende la información taxonómica, la información espacial, los datos asociados a la colecta y los datos descriptivos.

Aspectos a considerar durante la toma de datos en el campo:

  • Que la información de la etiqueta o cuaderno de campo sea correcta.
  • Que la información se ha registrado y documentado con precisión.
  • Que la información geográfica y la descripción de la localidad es lo más exacta y precisa posible. Y los niveles de precisión y exactitud están bien documentados (por ejemplo en la toma de coordenadas).
  • Que la metodología de la colección está completamente documentada.
  • Que las notas de campo son claras y no tienen ambigüedades.
  • Que las notas de campo son legibles para las personas que tienen que ingresar los datos.

Digitalización

Se refiere a la captura de información en forma electrónica. La unidad básica es el dato de biodiversidad. Puede adoptar distintos formatos: tablas, bases de datos planas o relacionales, mapas o archivos SIG (Sistema de Información Geográfica).

La forma de almacenar la información en una base de datos puede tener un efecto en su calidad. Algunos aspectos a considerar:

  • El modo en el que se capturan electrónicamente los datos y el diseño de la base de datos.
  • Archivar los datos en servidores accesibles para diversos responsables de la organización.
  • Documentar la ubicación de cada base de datos y su contenido (incluyendo tanto datos obsoletos como actuales).
  • La realización regular de copias de seguridad (backups) evita la pérdida de datos y garantiza unos niveles de calidad.

Control de calidad

Por más cuidadoso que sea el ingreso de datos, siempre habrá errores. Por ello, no se puede ignorar la validación y corrección de datos, especialmente cuando se trata de datos antiguos.


Publicación

En el contexto del SNDB la publicación consiste en compartir los datos al mundo a través de nuestra plataforma. Usando estándares globalmente aceptados, ofreciendo Acceso Abierto y uso de acuerdo con las licencias Creative Commons. Así, las instituciones, los originadores y los curadores de los datos reciben todo el crédito correspondiente.


Elaborá los metadatos

Realizá la descripción de tus datos: quién, qué, dónde, cuándo, cómo y por qué. Ello les permitirá a los usuarios conocer el contexto y el alcance de los datos publicados. A su vez, facilitarás que conozcan la forma de dar los créditos correspondientes.

Mirá más sobre ¿cómo completar los metadatos en el IPT?