Explorando los desafíos lógicos en la visualización y análisis de datos en arquitecturas de Big data: un enfoque en falacias, sesgos y paradojas
DOI:
https://doi.org/10.22458/rna.v15i1.5150Palabras clave:
Big data, falacias, sesgos, paradojas, análisis de datosResumen
Esta investigación cualitativa se centra en identificar y caracterizar los errores lógicos frecuentes en el análisis y la visualización de datos dentro de las arquitecturas de Big data, a través de una revisión bibliográfica exhaustiva, en la que se categorizan los errores en falacias, sesgos y paradojas. Este estudio busca servir como guía para profesionales en entornos públicos y privados, así como señalar áreas de investigación relacionadas con la epistemología y la ética en el ámbito del Big data. El texto plantea dos preguntas: ¿Cuáles son los errores lógicos más comunes que se encuentran en el análisis y la visualización de datos dentro de las arquitecturas de Big data? ¿Cómo pueden abordarse estos errores para mejorar tanto la calidad de la toma de decisiones como la ética en este campo? El artículo tiene cuatro objetivos: identificar y caracterizar las falacias, sesgos y paradojas más comunes en el análisis y la visualización de datos en arquitecturas de Big data; proporcionar orientación y conocimiento a profesionales que trabajan en el análisis y la visualización de datos en entornos públicos y privados; destacar la importancia de la epistemología y la ética en el contexto del Big data; y establecer líneas de investigación adicionales relacionadas con la mejora de la calidad de los análisis de datos y la promoción de prácticas éticas.
Citas
Atkins, Hazel, “Raising "The Rock": The Importance of T. S. Eliot's Pageant-Play”. Christianity and Literature, 62, n.o 2 (2013): 261- 282. https://doi.org/10.1177/014833311306200.
Barrantes, Rodrigo, “Investigación: un camino al conocimiento”, San José, Costa Rica: EUNED, 2016.
Borge, Bruno, “Realismo científico hoy: a 40 años de la formulación del Argumento del No-Milagro”. Revista Acta Scientiarum 37, n.o 2 (julio, 2015): 221-233. URL: http://www.redalyc.org/articulo.oa?id=307343306010.
Brooks, David, “The Philosophy of Data”, New York Times, 4 de febrero del 2013, edición en español, https://www.nytimes.com/2013/02/05/opinion/brooks-the-philosophy-of-data.html
Camargo-Vega, Juan., Camargo-Ortega, Jonathan., y Joyanes-Aguilar, Luis. “Conociendo Big data”. Revista de la Facultad de Ingeniería, 24, n.o 38(enero-junio 2015): 63-77, http://www.redalyc.org/articulo.oa?id=413940775006
Cerdas, Mónica, “Lotería Navideña: estos son los números que nunca han salido con el premio mayor”, El Financiero, 16 de diciembre del 2023, https://www.elfinancierocr.com/finanzas/loteria-navidena-estos-son-los-numeros-que-nunca/WGMMVS5TWZEH5CLRIW5YQ5CZPU/story/
Chen, Andrew, “DAU/MAU is an important metric to measure engagement, but here’s where it fails”., @andrewchen, s.f, https://andrewchen.com/dau-mau-is-an-important-metric-but-heres-where-it-fails/
Data Heroes, Noise in Machine Learning, Data Heroes blog, s.f, https://dataheroes.ai/glossary/noise-in-machine-learning/
Diebold, Francis, “On the Origin(s) and Development of the Term Big data”, PIER Working Paper n.o 12-037, septiembre 2012, https://dx.doi.org/10.2139/ssrn.2152421
Drayson, Matthew y Bashir, Amjad, “The Evolution of Data Management: A Practitioner Perspective”, https://www.dimensiondata.com/-/media/ntt/global/solutions/intelligent-business/intelligent-business-landing-page/evolution-of-data-management-ebook.pdf
Dykes, Brent, “A History Lesson On The Dangers Of Letting Data Speak For Itself”, Forbes, 9 de febrero del 2016, https://www.forbes.com/sites/brentdykes/2016/02/09/a-history-lesson-on-the-dangers-of-letting-data-speak-for-itself/?sh=7aed8c9d20e1
Elston, Dirk, “Survivorship Bias”, Journal of the American Academy of Dermatology, (2021), https://doi.org/10.1016/j.jaad.2021.06.845
Felton, James, “How A Helmet And A Bullet-Riddled Plane Perfectly Demonstrates Survivor Bias”, IFL Science, 14 de septiembre del 2021, https://www.iflscience.com/how-a-helmet-and-a-bulletriddled-plane-perfectly-demonstrates-survivor-bias-60930
García, Yamileth y Pérez, Yolanda, “Aplicación del discurso teórico en diversos espacios de la realidad social: un acercamiento sociológico entre actores sociales”, Revista Abra, 42, n.o. 65 (2022): 83-96, https://doi.org/10.15359/abra.42-65.5
Gupta, Vipin., Saini, Chhavi., Oberoi, Meher., Kalra, Gagan., y Imran, Nasir, “Semmelweis Reflex: An Age-Old Prejudice”, World Neurosurgery, 136 (2020): e119-e125, https://doi.org/10.1016/j.wneu.2019.12.012.
Hernández-Leal, Emilcy., Duque-Méndez, Néstor y Moreno-Cadavid, Julián, “Big data: una exploración de investigaciones, tecnologías y casos de aplicación”, TecnoLógicas 20, n.o 29, (2017): 17-24, http://www.scielo.org.co/scielo.php?pid=S0123-77992017000200002&script=sci_arttext
IBM, “Understanding the architectural layers of a Big data solution”, IBM blog, 15 de octubre del 2013, https://developer.ibm.com/articles/bd-archpatterns3/
Manterola, Carlos y Otzen, Tamara, “Los Sesgos en Investigación Clínica”, International Journal of Morphology 33, n.o. 3, (2015): 1156-1164, URL: https://www.scielo.cl/scielo.php?pid=S0717-95022015000300056&script=sci_arttext&tlng=pt.
Márquez, Jairo, “Inteligencia artificial y Big data como soluciones frente a la COVID-19”, Revista de Bioética y derecho. No.50, (2020): 315-331, https://scielo.isciii.es/scielo.php?pid=S1886-58872020000300019&script=sci_arttext
Martén, Sergio. “El problema epistemológico de los Big data en la producción de conocimiento científico”. Tesis de Maestría en Filosofía (2023). Universidad de Costa Rica.
Martínez, Sergio, “La navaja de Ockham y la heterogeneidad de las representaciones: hacia una ontología de lo abstracto”, Azafea Revista de filosofía 12, n.o. (2011):97-118, https://doi.org/10.14201/7999.
Martino, Silvia, “Repensar la empresa, la persona y el trabajo: Elton Mayo y algunos aportes antropológicos de Leonardo Polo”, Revista de Pensamiento y Cultura volumen 10, (2023): 173-195. DOI: http://dx.doi.org/10.31207/colloquia.v10i0.154
McCambridge, Jim., Witton, John y Elbourne, Diana, “Systematic review of the Hawthorne effect: New concepts are needed to study research participation effects”, Journal of Clinical Epidemiology 67, n.o. 3, (2014): 267-277, doi: 10.1016/j.jclinepi.2013.08.015.
Molinero, Luis, “La paradoja de Simpson”, Asociación de la Sociedad Española de Hipertensión, octubre del 2021, https://www.alceingenieria.net/bioestadistica/simpson.pdf
Mizrahi, Moti, “Historical Inductions: New Cherries, Same Old Cherry-picking”, International Studies in the Philosophy of Science, 29, n.o 2, (2015): 129-148, DOI:10.1080/02698595.2015.1119413
Mysore, Divakar., Khupat, Shrikant., y Jain, Shweta, “Understanding the architectural layers of a Big data solution”, IBM blog, 14 de octubre del 2013, https://developer.ibm.com/articles/bd-archpatterns3/
Nussbaumer, Cole, “Storytelling with data. A data visualization guide for business professionals”, New Jersey, Estados Unidos: John Wiley & Sons.
Nwammuo, Angela & Nwafor, Gideon, “How Online Newspaper Headlines Sway Opinion: Analysis of Online Newspaper Readership Patterns among Facebook Users”, International Journal of Informatics, Technology & Computers 5, n.o. 1, (2020): 1 – 10.
Pastor, Servando, “Alquimia: Cómo los datos se están transformando en oro”, Perfiles Económicos, n.o. 10, (2020): 173-177, http://doi.org/10.22370/pe.2020.10.2663.
Parusniková, Zuzana, “Popperian methodology and the Semmelweis case”, Medical Health Care and Philosophy 26, n.o. 4, (2023): 529–537. https://doi.org/10.1007/s11019-023-10167-7
Redacción, “70% de los hospitalizados por Covid-19 están vacunados”, aDiarioCR, 31 de enero del 2022, https://adiariocr.com/salud/70-de-los-hospitalizados-por-covid-19-estan-vacunados/
Sánchez, Óscar, “El Big data y su aplicación práctica en la estrategia de la empresa: Social Media Analytics”, Trabajo Final de Grado en Administración y Dirección de Empresas, Universidad Pontificia Comillas, 2019.
Scholl, Raphael, “Causal inference, mechanisms, and the Semmelweis case. Studies in History and Philosophy of Science”, 44, n.o. 1 (2013): 66–76. URL: https://www.sciencedirect.com/science/article/abs/pii/S0039368112000350
Sedwick, Philip y Greenwood, Nan, “Understanding the Hawthorne effect”, The BMJ: Endgames, (2015), https://doi.org/10.1136/bmj.h4672.
Singh y Shah, “Competency-based medical education and the McNamara fallacy: Assessing the important or making the assessed important?” Postgrad Med 69, n.o. 1 (2023):35-40. Doi: 10.4103/jpgm.jpgm_337_22.
Solano, Jonathan y Leiva, Estefany, “Big data Analytics: propuesta de una arquitectura”, 2014, San José, Costa Rica: ULACIT.
Soussi, Nisrrine y El Arass, Mohammed, “Data Cycle: From Big data to Smart Data”, Quinto congreso Internacional de IEEE, Marruecos: octubre del 2018.
Stanford Encyclopedia of Philosophy, Simpson’s Paradox, 21 de marzo del 2023, <https://plato.stanford.edu/archives/sum2021/entries/paradox-simpson/>.
Stöckl, Thomas., Jürgen, Huber., Kirchler, Michael y Lindner, Florian, “Hot hand and gambler's fallacy in teams: Evidence from investment experiments”, Journal of Economic Behavior & Organization, 117, (septiembre del 2015): 327-339, https://doi.org/10.1016/j.jebo.2015.07.004
Sujatha., Mayurnath, Reddy y Pooja, Pathak, “Camouflage in research – the hawthorne effect”. International Journal of Development Research, 09, n.o. 04, (2019): p. 26996-26999. ISSN: 2230-9926.URL: https://www.journalijdr.com/camouflage-research-%E2%80%93-hawthorne-effect
Tapia, Jeimy, “Macrodatos: almacenamiento y consulta de datos aplicados en las organizaciones”, Revista Ciencia administrativa, 2, 2022, ISSN 1870-9427.
Trianarts, “T. S. Eliot: El primer coro de la roca”, Trianarts blog, 12 de mayo del 2022, https://trianarts.com/acerca-de/#sthash.pG6DBi6R.dpbs
Valero, José, “La visualización de datos”, Revista Ámbitos, núm. 25, julio-diciembre 2014, https://www.redalyc.org/pdf/168/16832256009.pdf
Ventura, Dalia, “Qué es el "efecto cobra" (y cómo demuestra que a veces es peor el remedio que la enfermedad)”, BBC News Mundo, 21 de noviembre del 2020, https://www.bbc.com/mundo/noticias-54935306
Vigen, Tyler, “Spurious correlations”, s.f., https://www.tylervigen.com/spurious-correlations
Ying, Sue, “An Overview of Overfitting and its Solutions. Journal of Physics”, Conference Series 1168, n.o 2, 2019, doi:10.1088/1742-6596/1168/2/022022
Publicado
Cómo citar
Número
Sección
Categorías
Licencia
Derechos de autor 2024 Revista Nacional de Administración
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Aquellos autores/as que tengan publicaciones con esta revista, aceptan los términos siguientes:
- Los autores/as conservarán sus derechos de autor y garantizarán a la revista el derecho de primera publicación de su obra, el cuál estará simultáneamente sujeto a la Licencia de reconocimiento de Creative Commons que permite a terceros compartir la obra siempre que se indique su autor y su primera publicación esta revista.
- Los autores/as podrán adoptar otros acuerdos de licencia no exclusiva de distribución de la versión de la obra publicada (p. ej.: depositarla en un archivo telemático institucional o publicarla en un volumen monográfico) siempre que se indique la publicación inicial en esta revista.
- Se permite y recomienda a los autores/as difundir su obra publicada en la revista a través de Internet (p. ej.: en archivos telemáticos institucionales o en su página web).