Implementación del Método de Análisis de Componentes Principales (PCA) para la reducción de la dimensionalidad en los datos inmobiliarios de la ciudad de Riobamba

Autores/as

DOI:

https://doi.org/10.23857/dc.v10i3.4022

Palabras clave:

Análisis de Componentes Principales PCA, Datos inmobiliarios, Reducción de la Dimensionalidad

Resumen

El acelerado crecimiento inmobiliario en la ciudad de Riobamba ha generado un gran volumen de datos con desafíos de dimensionalidad y complejidad. En busca de una posible mejora del rendimiento en la implementación de modelos computacionales, esta investigación tiene como objetivo aplicar el método Análisis de Componentes Principales (PCA) para reducir la dimensionalidad en los datos inmobiliarios de la ciudad de Riobamba. La población de estudio comprende la información inmobiliaria de 2338 propiedades (bienes raíces) de la ciudad. El muestreo es de tipo censal, incluyen todos los registros del periodo 2018-2022. La investigación tiene un alcance explicativo, con un diseño cuasi – experimental. La investigación tiene un alcance explicativo y un diseño cuasi – experimental. Los resultados obtenidos muestran que, al aplicar PCA, la reducción de dimensionalidad fue satisfactoria para las variables numéricas. Al analizar los datos transformados, se observó que los componentes principales retenían un porcentaje significativo de la variabilidad total de los datos originales. Esto indica que las variables originales pueden ser representadas adecuadamente con un número reducido de componentes principales, lo que simplifica el modelo sin perder información relevante.

Biografía del autor/a

Carlos Antonio Aguirre Calderón, Universidad Nacional de Chimborazo

Ingeniero Civil. Maestrante en la Universidad Nacional de Chimborazo. Riobamba-Ecuador

Elba María Bodero Poveda, Universidad Nacional de Chimborazo

Doctora en Ciencias Informáticas. Docente e Investigadora del Grupo de Investigación en Telecomunicaciones, Informática, Industria y Construcción en la Universidad Nacional de Chimborazo. Riobamba-Ecuador

Citas

Bodero, E., Lopez, M., Congacha, A., Cajamarca, E., & Morales, C. (2020a). Google Colaboratory como alternativa para el procesamiento de una red neuronal convolucional. Revista ESPACIOS, 41(07). https://www.revistaespacios.com/a20v41n07/20410722.html

Bodero, E., Morales, C., Congacha, A., & Ramos, C. (2022b). Técnicas de minería de datos para el análisis de la plusvalía inmobiliaria. Dominio de las Ciencias, 8(1). https://doi.org/10.23857/dc.v8i41.2531

Cheng, Z., Wang, S., Zhang, P., Wang, S., Liu, X., & Zhu, E. (2021). Improved autoencoder for unsupervised anomaly detection. International Journal of Intelligent Systems, 36(12), 7103-7125. https://doi.org/10.1002/int.22582

Cruz, E., González, M., & Rangel, J. (2022). Técnicas de machine learning aplicadas a la evaluación del rendimiento y a la predicción de la deserción de estudiantes universitarios, una revisión. Prisma Tecnológico, 13(1), Article 1. https://doi.org/10.33412/pri.v13.1.3039

Dray, S. (2008). On the number of principal components: A test of dimensionality based on measurements of similarity between matrices. Computational Statistics & Data Analysis, 52(4), 2228-2237. https://doi.org/10.1016/j.csda.2007.07.015

Garcia-Alvarez, D., & Fuente, M. (2011). Estudio comparativo de técnicas de detección de fallos basadas en el Análisis de Componentes Principales (PCA). Revista Iberoamericana de Automática e Informática Industrial RIAI, 8(3), 182-195. https://doi.org/10.1016/j.riai.2011.06.006

Gonzalez, V., Conde, G., & Muñoz, A. (2021). Análisis de Componentes Principales en presencia de datos faltantes: El principio de datos disponibles: Principal Components Analysis in the presence of missing data: the principle of available data. Scientia et Technica, 26(2), Article 2. https://doi.org/10.22517/23447214.20591

Jiménez, J., Herrera, A., & Rojas, W. (2002). Fuentes de Varianza e Indices de Varianza Explicada en las Ciencias del Movimiento Humano. Pensar en Movimiento: Revista de Ciencias del Ejercicio y la Salud, 2(2), Article 2. https://doi.org/10.15517/pensarmov.v2i2.398

Kurita, T. (2019). Principal Component Analysis (PCA). In Computer Vision: A Reference Guide (pp. 1-4). Springer International Publishing. https://doi.org/10.1007/978-3-030-03243-2_649-1

Mishra, S., Sarkar, U., Taraphder, S., Datta, S., Swain, D., Saikhom, R., Panda, S., & Laishram, M. (2017). Multivariate statistical data analysis-principal component analysis (PCA). International Journal of Livestock Research, 7(5), 60-78. https://acortar.link/NVFGPE

Mostofi, F., To?an, V., & Ba?a?a, H. (2022). Real-estate price prediction with deep neural network and principal component analysis. Organization, Technology and Management in Construction, 14(1), 2741-2759. https://doi.org/10.2478/otmcj-2022-0016

Pernice, S. (2024). El problema de la reducción dimensional. Análisis de Componentes Principales (PCA). Revista Mutis, 14(1), Article 1. https://doi.org/10.21789/22561498.2057

Quiroga, C., & Villalobos, A. (2015). Análisis del comportamiento bursátil de las principales bolsas financieras en el mundo usando el análisis multivariado (análisis de componentes principales PCA) para el periodo de 2011 a 2014 (Analysis of Stock Market Behavior of the Major Financial Exchanges Worldwide Using Multivariate Analysis (Principal Component Analysis PCA) for the Period 2011 to 2014). Revista CEA, 1(2). https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3520246

Rivas, J., & Cerrillo, S. (2014). Un Algoritmo Genético para Selección de Kernel en Análisis de Componentes Principales con Kernels. Investigación Operacional, 35(2), Article 2. https://revistas.uh.cu/invoperacional/article/view/4713

Sarker, I. (2021). Machine Learning: Algorithms, Real-World Applications and Research Directions. SN Computer Science, 2(3), 160. https://doi.org/10.1007/s42979-021-00592-x

Wang, Z., Zhang, G., Xing, X., Xu, X., & Sun, T. (2024a). Comparison of dimensionality reduction techniques for multi-variable spatiotemporal flow fields. Ocean Engineering, 291, 116421. https://doi.org/10.1016/j.oceaneng.2023.116421

Wang, Z., Li, W., & Tang, Z. (2024b). Enhancing the genomic prediction accuracy of swine agricultural economic traits using an expanded one-hot encoding in CNN models1. Journal of Integrative Agriculture. https://doi.org/10.1016/j.jia.2024.03.071

Descargas

Publicado

2024-09-17

Cómo citar

Carlos Antonio Aguirre Calderón, & Elba María Bodero Poveda. (2024). Implementación del Método de Análisis de Componentes Principales (PCA) para la reducción de la dimensionalidad en los datos inmobiliarios de la ciudad de Riobamba. Dominio De Las Ciencias, 10(3), 2032–2051. https://doi.org/10.23857/dc.v10i3.4022

Número

Sección

Artí­culos Cientí­ficos