La curación de datos es un término muy utilizado desde hace años en el mundo de la tecnología ya que en el mundo del Big Data la curación de datos es transcendental. No obstante, este término en el ámbito científico ha sido empleado de manera incorrecta ya que la curación de datos en esta esfera alude a la técnica de extracción de información más relevante en los escritos científicos, para ser compartido en formato electrónico. A menudo se observa que las personas hacen referencia a la curación de datos, solo por el simple hecho de estar en un repositorio, fichero o almacén de datos. Asimismo, se cree que por estar los datos de manera accesible también son curados. De modo que, la creación de datos es un término que no se maneja adecuadamente en el ámbito científico ya que curar datos implica mucho más que almacenar datos en una base de datos compartida.
Desde hace varias décadas, el uso tradicional de la palabra curación se asocia con las colecciones de enseres en un museo y obras de arte en una galería. En el ámbito del marketing el autor Bhargava define que un curador es una persona que inagotablemente “encuentra, agrupa, organiza y comparte online el mejor y más relevante contenido sobre un tema específico” (2009, p.1). En el ámbito tecnológico, Miller manifiesta que “la curación de datos incluye todos los procesos necesarios para la creación, el mantenimiento y la gestión de datos controlados y basados en principios, junto con la capacidad de agregar valor a los datos” (2014, p.4). Por lo tanto, la curación es un trabajo donde se organiza y administra una colección para satisfacer las necesidades e intereses de un grupo específico de personas.
Por consiguiente, la curación:
reside el proceso de distinguir la información relevante, en otras palabras, la información verdadera, que ya está publicada en Internet, a través de la DEPURACIÓN, ORGANIZACIÓN y ACREDITACIÓN con un valor adicional, para poder ser difundida a las comunidades, redes, instituciones con un formato de calidad (Mujica-Sequera, 2021).
Hay que mencionar, además que «el trabajo de curador de contenido no radica en la creación de contenidos, sino en potencializar los contenidos existentes para que se utilicen como fuente de inspiradora del conocimiento» (Mujica-Sequera, 2020). Asimismo, es importante señalar que el enfoque en este ámbito son los conjuntos de datos (archivos, tablas, entre otros.) a los que se puede acceder y analizar. La distinción entre «colecciones de datos» y «colecciones de conjuntos de datos» es sutil pero significativa.
Debido al avance tecnológico y al incremento de investigaciones científicas a nivel mundial, los catálogos de datos se han convirtiendo rápidamente en el nuevo «estándar de oro» para la gestión de metadatos, haciendo que los metadatos sean accesibles e informativos para los consumidores de datos no técnicos. Ahora bien, ¿quiénes son los encargados de la curación de datos? Los curadores por lo general son personas capacitadas con diversos grados de responsabilidad y compromiso. Todos los que trabajan con datos tienen la oportunidad de curar compartiendo sus conocimientos y experiencias. El crowdsourcing del conocimiento que traducido al español corresponde a la colaboración, distribuida o externalización de tareas abiertas, es una parte importante de la práctica de la curación. En otras palabras, la gestión colaborativa de los datos es una necesidad en el mundo del autoservicio y el intercambio de conocimientos es el primer paso para crear una cultura colaborativa.
En síntesis, los curadores de datos son personas que tienen experiencia en dominios de datos específicos, como clientes, productos, finanzas, investigación, entre otros. Los curadores registran y comparten el conocimiento del dominio de datos que ayuda a los analistas de datos a comprender la naturaleza de los datos con los que trabajan. Por ende, en la actualidad son muy pocas las organizaciones que cuentan con un curador responsables de moderar el contenido. Por ello, la organización y gestión son los elementos críticos de la curación, como, lo es el hacer que las cosas sean fáciles de encontrar, comprender y acceder son determinantes en las bases de datos científicas.
Referencias
Bhargava, R. (2009). Manifesto for the content curator: the next big social media job of the future? Influentional Marketing Blog.
Miller, R. (2014). Big Data Curation. 20th International Conference on Management of Data (COMAD). Hyderabad.
Mujica-Sequera, R. [Docentes 2.]. (2020). ¿Qué es la Curación de Contenidos ? [Video]. YouTube. https://youtu.be/6MQNR7WRObU
Mujica-Sequera, R. [Docentes 2.]. (2021). Usos pedagógicos y herramientas para la curación de contenidos [Video]. YouTube. https://youtu.be/l-KSAkzuTwI