Comparación de técnicas estadísticas multivariadas usadas en datos cualitativos

Autores/as

DOI:

https://doi.org/10.23857/dc.v9i3.3522

Palabras clave:

Técnicas multivariadas, datos cualitativos, agrupamiento jerárquico en componentes principales, agrupación jerárquica, árbol de cohesión, árbol de similaridad

Resumen

El avance de la estadística ha permitido el perfeccionamiento hacia técnicas estadísticas multivariadas con una gran cantidad de variables. Dichas técnicas permiten la interpretación, análisis y descripción simultánea de varias variables relacionadas a un conjunto de individuos, entonces resulta importante la comparación de las distintas técnicas estadísticas disponibles para evaluar los métodos más óptimos en cuanto al uso del tiempo y memoria del dispositivo. Por ello, en esta investigación se consideraron los métodos MHCPC (agrupamiento jerárquico en componentes principales), MSIM (agrupación jerárquica), Hrarchy (árbol de cohesión) y Hsimy (árbol de similaridad) y se plantearon los siguientes objetivos: comparar bajo el criterio de tiempo de ejecución, los métodos MHCPC, MSIM, Hrarchy y Hsimy para datos cualitativos, y comparar bajo el criterio de cantidad de memoria, los métodos MHCPC, MSIM, Hrarchy y Hsimy para datos cualitativos. Se utilizó un enfoque cuantitativo con un tipo de inferencia inductivo con un diseño experimental – pre experimental por la manipulación de variables de forma aleatoria. Los resultados muestran que se obtuvieron cinco grupos homogéneos, de los cuales en relación al tiempo de ejecución, se debe considerar la menor varianza por cuanto no existen diferencias significativas. Por su parte, respecto al uso de memoria en el grupo 1 se puede utilizar cualquiera de los cuatro métodos, pero para los grupos 2, 3, 4 y 5 los mejores métodos serían MHCPC o SIM porque ocupan menos memoria y son similares entre ellos.

Biografía del autor/a

Natalia Alexandra Pérez Londo, Escuela Superior Politécnica de Chimborazo

Máster Universitario en Estadística Aplicada, Docente ocasional en Escuela Superior Politécnica de Chimborazo; Riobamba, Ecuador.

Darwin Saul Lema Londo, Unidad Educativa Vigotsky

Ingeniero Mecánico, Docente en Unidad Educativa Vigotsky; Riobamba, Ecuador.

Nataly Alejandra Batallas Carrillo

Ingeniera en Estadística Informática, Investigadora Independiente; Santo Domingo, Ecuador.

Rubén Antonio Pazmiño Maji, Escuela Superior Politécnica de Chimborazo

Doctor dentro del Programa de Doctorado en Formación en la Sociedad del Conocimiento, Docente en Escuela Superior Politécnica de Chimborazo; Riobamba, Ecuador.

Citas

Álvarez-Perdomo. P., Tamayo, M., y Govea, J., (2022). Técnicas multivariadas: una contribución al análisis económico financiero en PYMES bananeras ecuatorianas. Revista Universidad y Sociedad. 14(4). 475-485. Epub 30 de agosto de 2022. http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S2218-36202022000400475&lng=es&tlng=pt.

Batallas, N. (2022). Análisis de las características de la Educación Superior Ecuatoriana en tiempos de la pandemia: Comparación de técnicas multivariadas. [Tesis de grado, Riobamba: Escuela Superior Politécnica de Chimborazo (ESPOCH)].

Chan, D., y Galli, M., (2020). Aplicación de técnicas estadísticas multivariadas con el lenguaje de programación R en investigaciones educativas del nivel superior. Revista Argentina de Educación Superior (RAES). 12(20). 123-136. https://dialnet.unirioja.es/servlet/articulo?codigo=7592065

Cohen-Addad, V., Kanade, V., Mallmann-Trenn, F., & Mathieu, C., (2019). Hierarchical clustering: Objective functions and algorithms. Journal of the ACM (JACM). 66(4). 1-42. https://doi.org/10.1145/3321386.

Fotiadis, T. A., & Anastasiadou, S. (2019). Contemporary advanced statistical methods for the science of marketing: Implicative Statistical Analysis vs Principal Components Analysis. International Journal of Entrepreneurship and Innovative Competitiveness – IJEIC 1(1) http://hephaestus.nup.ac.cy/handle/11728/11393.

Govender, P., & Sivakumar, V., (2020). Application of k-means and hierarchical clustering techniques for analysis of air pollution: A review (1980–2019). Atmospheric pollution research. 11(1). 40-56. https://doi.org/10.1016/j.apr.2019.09.009

Hidalgo, A., (2019). Técnicas estadísticas en el análisis cuantitativo de datos. Revista sigma. 15(1). 28-44. http://coes.udenar.edu.co/revistasigma/articulosXV/1.pdf

Koh, K., Y., Ahmad, S., Lee, J., I., Suh, G., H., & Lee, C., M., (2022). Hierarchical clustering on principal components analysis to detect clusters of highly pathogenic avian influenza subtype H5N6 epidemic across South Korean Poultry Farms. Symmetry. 14(3). 598. https://doi.org/10.3390/sym14030598

Martín del Campo, C., (2019). Atribución de autoría con aprendizaje automático. [Tesis de maestría. México: Instituto Politécnico Nacional] https://tesis.ipn.mx/bitstream/handle/123456789/27768/T2006.pdf?sequence=1&isAllowed=y.

Maugeri, A., Barchitta, M., Basile, G., & Agodi, A., (2021). Applying a hierarchical clustering on principal components approach to identify different patterns of the SARS-CoV-2 epidemic across Italian regions. Scientific reports. 11(1). 7082. https://doi.org/10.1038/s41598-021-86703-3.

Naranjo, M., Pazmiño, R., Conde, M. y Peñalvo, F., (2018, junio). Métodos de agrupamiento LA & SIA: Comparación computacional. En Congreso de Ciencia y Tecnología ESPE 13(1). https://doi.org/10.24133/cctespe.v13i1.817

Pazmiño-Maji, R. A., García-Peñalvo, F. J., & Conde-González, M. A. (2017, October). Comparing hierarchical trees in statistical implicative analysis & hierarchical cluster in learning analytics. In Proceedings of the 5th International Conference on Technological Ecosystems for Enhancing Multiculturality (pp. 1-7). https://doi.org/10.1145/3144826.3145399

Pulido, M. (2020). Aportes del análisis multivariante en planificación por escenarios. @ limentech. Ciencia y Tecnología Alimentaria. 18(2). 25-51. https://revistas.unipamplona.edu.co/ojs_viceinves/index.php/ALIMEN/article/view/4152/2639.

Sagaró del Campo, N. M., y Zamora, L. (2019a). Evolución histórica de las técnicas estadísticas y las metodologías para el estudio de la causalidad en ciencias médicas. Medisan. 23(3). 534-556. https://medisan.sld.cu/index.php/san/article/view/2434

Sagaró del Campo, N. M., y Zamora-Matamoros, L. (2019b). Métodos gráficos en la investigación biomédica de causalidad. Revista Electrónica Dr. Zoilo E. Marinello Vidaurreta, 44(4). https://revzoilomarinello.sld.cu/index.php/zmv/article/view/1846.

Sagaró del Campo, N. M., y Zamora, L. (2020). ¿Cómo interpretar los resultados del análisis estadístico implicativo en los estudios de causalidad en Salud? MediSur, 18(2), 292-306. http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1727-897X2020000200292&lng=es&tlng=es.

Vargas, J. J., Muñoz, J. J., Paba, N. A., y Ordoñez, N. (2020). Aplicación de la técnica multivariada Manova a dos variables de control provenientes de tres modelos de simulación estocásticos de un proceso productivo. Entre Ciencia e Ingeniería. 14(28). 66-75. https://doi.org/10.31908/19098367.2056

Descargas

Publicado

2023-08-21

Cómo citar

Pérez Londo, N. A., Lema Londo, D. S., Batallas Carrillo, N. A., & Pazmiño Maji, R. A. (2023). Comparación de técnicas estadísticas multivariadas usadas en datos cualitativos. Dominio De Las Ciencias, 9(3), 1725–1741. https://doi.org/10.23857/dc.v9i3.3522

Número

Sección

Artí­culos Cientí­ficos