✍LA CALIDAD DE LOS DATOS EN LA INVESTIGACIÓN | DOCENTES 2.0

En el manejo y la calidad de los datos dentro de una organización o investigación se ha convertido en un componente crucial en la sociedad del conocimiento. Las organizaciones e investigaciones que manejan datos de alta calidad tienen mejores procesos de toma de decisiones, mejores planes de estrategia y excelentes patrones para una mejor resolución de problemas. La incapacidad de proporcionar datos de alta calidad en las investigaciones ha llevado a las organizaciones a tener problemas como la insatisfacción, altos costos operativos y decisiones equivocadas debido a datos incorrectos (Strong, Lee & Wang, 1997). Varios estudios sobre calidad de datos han revelado numerosos avances en la definición de medidas, dimensiones, técnicas, calidad, evaluación y modelos de mejora de datos. Dado que los antecedentes de la calidad de los datos son amplios, los científicos e investigadores han decidido que la alta calidad de los datos se caracteriza por su uso y satisfacen todas las condiciones establecidas por los usuarios (Lee & Strong, 2003).

La valoración de la calidad de los datos es esencial en la investigación y juega un rol crucial en la evaluación de la practicidad de los datos recopilados del proceso de análisis (Shirai, Nichols & Kasunic, 2014). Algunos campos que han estudiado la calidad de los datos incluyen los datos multimedia, Internet de las cosas, ciudades inteligentes, aprendizaje profundo, aprendizaje automático, análisis y gestión de Big data, conjunto de datos de medicamentos y sistemas vivos. La metodología utilizada en este estudio cualitativo es la revisión narrativa de la literatura existente, principalmente desde la perspectiva de los profesionales que actualmente están involucrados en el desarrollo de sistemas automatizados de calidad de datos. Por ello, los autores Batini & Scannapieca (2006) sustentan que los datos son el nuevo petróleo porque se puede almacenar, elaborar y recuperar a través de un proceso basado en software y puede comunicarse a través de una red. Los investigadores han clasificado los datos en diferentes tipos en diferentes áreas:

  1. Datos estructurados: Generalización de objetos definidos por características básicas definidas dentro de un campo.
  2. No estructurados: Son un encadenamiento de símbolos codificados en lenguaje natural.
  3. Semiestructuradas: Datos que poseen una estructura con cierto nivel de flexibilidad.

La calidad de los datos es una idea multidimensional, ya que la calidad de los datos se puede evaluar considerando una gama de alcances aplicables a un campo específico. Existen tres enfoques diferentes para evaluar las dimensiones de la calidad de los datos: empírico, teórico e intuitivo.

  1. Método empírico: Se emplea para analizar los datos recopilados. En término general para técnicas de investigación, se concluyen a partir de la evidencia observable.
  2. Método teórico: Se centra en que los datos se vuelvan incompletos durante el proceso de construcción. La dimensión de la calidad de los datos se deriva de posibles inconsistencias entre cómo el usuario ve el sistema práctico, como se infiere del sistema de información y la vista recopilada al observar abiertamente el sistema práctico.
  3. Método intuitivo: Los datos se elige en función de la experiencia y conocimiento del investigador sobre qué características son vitales en un marco específico.

En síntesis, el avance de la tecnología está haciendo que los datos atraviesen otros dominios, a diferencia de estar limitados a la base de datos. Numerosas fuentes de datos, como las redes sociales y los sitios web, se están volviendo cruciales para las organizaciones, investigaciones y construcción de relaciones. Por ende, al momento de manejar la calidad de los datos dentro de una organización o investigación, se debe adoptar la gestión de la calidad de los datos. La incorporación de este modelo de gestión y metodologías puede requerir mejoras para admitir diferentes fuentes de datos en datos no etiquetados.

Referencias

Batini, C. and Scannapieca, M. (2006) Data Quality: Concepts, Methodologies, and Techniques. Springer, Berlin, Heidelberg. https://doi.org/10.1007/3-540-33173-5

Lee, Y.W. and Strong, D.M. (2003) Knowing-Why about Data Processes and Data Quality. Journal of Management Information Systems, 20, 13-39. https://doi.org/10.1080/07421222.2003.11045775

Shirai, Y., Nichols, W. and Kasunic, M. (2014) Initial Evaluation of Data Quality in a TSP Software Engineering Project Data Repository. Proceedings of the 2014 International Conference on Software and System Process, Nanjing, 26-28 May 2014, 25-29.

Strong, D.M., Lee, Y.W. and Wang, R.Y. (1997) Data Quality in Context. Communications of the ACM, 40, 103-110. https://doi.org/10.1145/253769.253804

 


Ruth Mujica

Ruth M. Mujica-Sequera

Autor del Blog Docentes 2.0: Dra. Ruth Mujica-Sequera, es venezolana y está residenciada en el Medio Oriente desde el año 2011. Fundadora y CEO de Docentes 2.0 y la Revista Tecnológica-Educativa Docentes 2.0. Ingeniero de Sistema con Doctorado en Tecnología Educativa y Posdoctorado en Ciencias. La Dra. Ruth Mujica-Sequera es la Embajadora Latinoamericana de la Tecnología Educativa - Embajadora Nacional de Venezuela reconocida por ReviewerCredits