Comparación de técnicas estadísticas multivariadas usadas en datos cualitativos
DOI:
https://doi.org/10.23857/dc.v9i3.3522Palabras clave:
Técnicas multivariadas, datos cualitativos, agrupamiento jerárquico en componentes principales, agrupación jerárquica, árbol de cohesión, árbol de similaridadResumen
El avance de la estadística ha permitido el perfeccionamiento hacia técnicas estadísticas multivariadas con una gran cantidad de variables. Dichas técnicas permiten la interpretación, análisis y descripción simultánea de varias variables relacionadas a un conjunto de individuos, entonces resulta importante la comparación de las distintas técnicas estadísticas disponibles para evaluar los métodos más óptimos en cuanto al uso del tiempo y memoria del dispositivo. Por ello, en esta investigación se consideraron los métodos MHCPC (agrupamiento jerárquico en componentes principales), MSIM (agrupación jerárquica), Hrarchy (árbol de cohesión) y Hsimy (árbol de similaridad) y se plantearon los siguientes objetivos: comparar bajo el criterio de tiempo de ejecución, los métodos MHCPC, MSIM, Hrarchy y Hsimy para datos cualitativos, y comparar bajo el criterio de cantidad de memoria, los métodos MHCPC, MSIM, Hrarchy y Hsimy para datos cualitativos. Se utilizó un enfoque cuantitativo con un tipo de inferencia inductivo con un diseño experimental – pre experimental por la manipulación de variables de forma aleatoria. Los resultados muestran que se obtuvieron cinco grupos homogéneos, de los cuales en relación al tiempo de ejecución, se debe considerar la menor varianza por cuanto no existen diferencias significativas. Por su parte, respecto al uso de memoria en el grupo 1 se puede utilizar cualquiera de los cuatro métodos, pero para los grupos 2, 3, 4 y 5 los mejores métodos serían MHCPC o SIM porque ocupan menos memoria y son similares entre ellos.
Citas
Álvarez-Perdomo. P., Tamayo, M., y Govea, J., (2022). Técnicas multivariadas: una contribución al análisis económico financiero en PYMES bananeras ecuatorianas. Revista Universidad y Sociedad. 14(4). 475-485. Epub 30 de agosto de 2022. http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S2218-36202022000400475&lng=es&tlng=pt.
Batallas, N. (2022). Análisis de las características de la Educación Superior Ecuatoriana en tiempos de la pandemia: Comparación de técnicas multivariadas. [Tesis de grado, Riobamba: Escuela Superior Politécnica de Chimborazo (ESPOCH)].
Chan, D., y Galli, M., (2020). Aplicación de técnicas estadísticas multivariadas con el lenguaje de programación R en investigaciones educativas del nivel superior. Revista Argentina de Educación Superior (RAES). 12(20). 123-136. https://dialnet.unirioja.es/servlet/articulo?codigo=7592065
Cohen-Addad, V., Kanade, V., Mallmann-Trenn, F., & Mathieu, C., (2019). Hierarchical clustering: Objective functions and algorithms. Journal of the ACM (JACM). 66(4). 1-42. https://doi.org/10.1145/3321386.
Fotiadis, T. A., & Anastasiadou, S. (2019). Contemporary advanced statistical methods for the science of marketing: Implicative Statistical Analysis vs Principal Components Analysis. International Journal of Entrepreneurship and Innovative Competitiveness – IJEIC 1(1) http://hephaestus.nup.ac.cy/handle/11728/11393.
Govender, P., & Sivakumar, V., (2020). Application of k-means and hierarchical clustering techniques for analysis of air pollution: A review (1980–2019). Atmospheric pollution research. 11(1). 40-56. https://doi.org/10.1016/j.apr.2019.09.009
Hidalgo, A., (2019). Técnicas estadísticas en el análisis cuantitativo de datos. Revista sigma. 15(1). 28-44. http://coes.udenar.edu.co/revistasigma/articulosXV/1.pdf
Koh, K., Y., Ahmad, S., Lee, J., I., Suh, G., H., & Lee, C., M., (2022). Hierarchical clustering on principal components analysis to detect clusters of highly pathogenic avian influenza subtype H5N6 epidemic across South Korean Poultry Farms. Symmetry. 14(3). 598. https://doi.org/10.3390/sym14030598
Martín del Campo, C., (2019). Atribución de autoría con aprendizaje automático. [Tesis de maestría. México: Instituto Politécnico Nacional] https://tesis.ipn.mx/bitstream/handle/123456789/27768/T2006.pdf?sequence=1&isAllowed=y.
Maugeri, A., Barchitta, M., Basile, G., & Agodi, A., (2021). Applying a hierarchical clustering on principal components approach to identify different patterns of the SARS-CoV-2 epidemic across Italian regions. Scientific reports. 11(1). 7082. https://doi.org/10.1038/s41598-021-86703-3.
Naranjo, M., Pazmiño, R., Conde, M. y Peñalvo, F., (2018, junio). Métodos de agrupamiento LA & SIA: Comparación computacional. En Congreso de Ciencia y Tecnología ESPE 13(1). https://doi.org/10.24133/cctespe.v13i1.817
Pazmiño-Maji, R. A., García-Peñalvo, F. J., & Conde-González, M. A. (2017, October). Comparing hierarchical trees in statistical implicative analysis & hierarchical cluster in learning analytics. In Proceedings of the 5th International Conference on Technological Ecosystems for Enhancing Multiculturality (pp. 1-7). https://doi.org/10.1145/3144826.3145399
Pulido, M. (2020). Aportes del análisis multivariante en planificación por escenarios. @ limentech. Ciencia y Tecnología Alimentaria. 18(2). 25-51. https://revistas.unipamplona.edu.co/ojs_viceinves/index.php/ALIMEN/article/view/4152/2639.
Sagaró del Campo, N. M., y Zamora, L. (2019a). Evolución histórica de las técnicas estadísticas y las metodologías para el estudio de la causalidad en ciencias médicas. Medisan. 23(3). 534-556. https://medisan.sld.cu/index.php/san/article/view/2434
Sagaró del Campo, N. M., y Zamora-Matamoros, L. (2019b). Métodos gráficos en la investigación biomédica de causalidad. Revista Electrónica Dr. Zoilo E. Marinello Vidaurreta, 44(4). https://revzoilomarinello.sld.cu/index.php/zmv/article/view/1846.
Sagaró del Campo, N. M., y Zamora, L. (2020). ¿Cómo interpretar los resultados del análisis estadístico implicativo en los estudios de causalidad en Salud? MediSur, 18(2), 292-306. http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1727-897X2020000200292&lng=es&tlng=es.
Vargas, J. J., Muñoz, J. J., Paba, N. A., y Ordoñez, N. (2020). Aplicación de la técnica multivariada Manova a dos variables de control provenientes de tres modelos de simulación estocásticos de un proceso productivo. Entre Ciencia e Ingeniería. 14(28). 66-75. https://doi.org/10.31908/19098367.2056
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2023 Natalia Alexandra Pérez Londo, Darwin Saul Lema Londo, Nataly Alejandra Batallas Carrillo, Rubén Antonio Pazmiño Maji
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Authors retain copyright and guarantee the Journal the right to be the first publication of the work. These are covered by a Creative Commons (CC BY-NC-ND 4.0) license that allows others to share the work with an acknowledgment of the work authorship and the initial publication in this journal.