Exploring Logical Challenges in Data Visualization and Analysis in Big data Architectures: A Focus on Fallacies, Biases, and Paradoxes
DOI:
https://doi.org/10.22458/rna.v15i1.5150Keywords:
Big data, fallacies, biases, paradoxes, data analysisAbstract
In this qualitative research, an identification and characterization of some of the main logical errors made when analyzing and visualizing data in Big Data architectures are conducted through a documentary and bibliographic review. It is worth noting that errors are systematized considering three categories: fallacies, biases, and paradoxes. The article aims to serve as guidance for individuals engaged in these tasks in both public and private sectors. Additionally, it provides insight into research lines related to epistemology and ethics in Big Data.
References
Atkins, Hazel, “Raising "The Rock": The Importance of T. S. Eliot's Pageant-Play”. Christianity and Literature, 62, n.o 2 (2013): 261- 282. https://doi.org/10.1177/014833311306200.
Barrantes, Rodrigo, “Investigación: un camino al conocimiento”, San José, Costa Rica: EUNED, 2016.
Borge, Bruno, “Realismo científico hoy: a 40 años de la formulación del Argumento del No-Milagro”. Revista Acta Scientiarum 37, n.o 2 (julio, 2015): 221-233. URL: http://www.redalyc.org/articulo.oa?id=307343306010.
Brooks, David, “The Philosophy of Data”, New York Times, 4 de febrero del 2013, edición en español, https://www.nytimes.com/2013/02/05/opinion/brooks-the-philosophy-of-data.html
Camargo-Vega, Juan., Camargo-Ortega, Jonathan., y Joyanes-Aguilar, Luis. “Conociendo Big data”. Revista de la Facultad de Ingeniería, 24, n.o 38(enero-junio 2015): 63-77, http://www.redalyc.org/articulo.oa?id=413940775006
Cerdas, Mónica, “Lotería Navideña: estos son los números que nunca han salido con el premio mayor”, El Financiero, 16 de diciembre del 2023, https://www.elfinancierocr.com/finanzas/loteria-navidena-estos-son-los-numeros-que-nunca/WGMMVS5TWZEH5CLRIW5YQ5CZPU/story/
Chen, Andrew, “DAU/MAU is an important metric to measure engagement, but here’s where it fails”., @andrewchen, s.f, https://andrewchen.com/dau-mau-is-an-important-metric-but-heres-where-it-fails/
Data Heroes, Noise in Machine Learning, Data Heroes blog, s.f, https://dataheroes.ai/glossary/noise-in-machine-learning/
Diebold, Francis, “On the Origin(s) and Development of the Term Big data”, PIER Working Paper n.o 12-037, septiembre 2012, https://dx.doi.org/10.2139/ssrn.2152421
Drayson, Matthew y Bashir, Amjad, “The Evolution of Data Management: A Practitioner Perspective”, https://www.dimensiondata.com/-/media/ntt/global/solutions/intelligent-business/intelligent-business-landing-page/evolution-of-data-management-ebook.pdf
Dykes, Brent, “A History Lesson On The Dangers Of Letting Data Speak For Itself”, Forbes, 9 de febrero del 2016, https://www.forbes.com/sites/brentdykes/2016/02/09/a-history-lesson-on-the-dangers-of-letting-data-speak-for-itself/?sh=7aed8c9d20e1
Elston, Dirk, “Survivorship Bias”, Journal of the American Academy of Dermatology, (2021), https://doi.org/10.1016/j.jaad.2021.06.845
Felton, James, “How A Helmet And A Bullet-Riddled Plane Perfectly Demonstrates Survivor Bias”, IFL Science, 14 de septiembre del 2021, https://www.iflscience.com/how-a-helmet-and-a-bulletriddled-plane-perfectly-demonstrates-survivor-bias-60930
García, Yamileth y Pérez, Yolanda, “Aplicación del discurso teórico en diversos espacios de la realidad social: un acercamiento sociológico entre actores sociales”, Revista Abra, 42, n.o. 65 (2022): 83-96, https://doi.org/10.15359/abra.42-65.5
Gupta, Vipin., Saini, Chhavi., Oberoi, Meher., Kalra, Gagan., y Imran, Nasir, “Semmelweis Reflex: An Age-Old Prejudice”, World Neurosurgery, 136 (2020): e119-e125, https://doi.org/10.1016/j.wneu.2019.12.012.
Hernández-Leal, Emilcy., Duque-Méndez, Néstor y Moreno-Cadavid, Julián, “Big data: una exploración de investigaciones, tecnologías y casos de aplicación”, TecnoLógicas 20, n.o 29, (2017): 17-24, http://www.scielo.org.co/scielo.php?pid=S0123-77992017000200002&script=sci_arttext
IBM, “Understanding the architectural layers of a Big data solution”, IBM blog, 15 de octubre del 2013, https://developer.ibm.com/articles/bd-archpatterns3/
Manterola, Carlos y Otzen, Tamara, “Los Sesgos en Investigación Clínica”, International Journal of Morphology 33, n.o. 3, (2015): 1156-1164, URL: https://www.scielo.cl/scielo.php?pid=S0717-95022015000300056&script=sci_arttext&tlng=pt.
Márquez, Jairo, “Inteligencia artificial y Big data como soluciones frente a la COVID-19”, Revista de Bioética y derecho. No.50, (2020): 315-331, https://scielo.isciii.es/scielo.php?pid=S1886-58872020000300019&script=sci_arttext
Martén, Sergio. “El problema epistemológico de los Big data en la producción de conocimiento científico”. Tesis de Maestría en Filosofía (2023). Universidad de Costa Rica.
Martínez, Sergio, “La navaja de Ockham y la heterogeneidad de las representaciones: hacia una ontología de lo abstracto”, Azafea Revista de filosofía 12, n.o. (2011):97-118, https://doi.org/10.14201/7999.
Martino, Silvia, “Repensar la empresa, la persona y el trabajo: Elton Mayo y algunos aportes antropológicos de Leonardo Polo”, Revista de Pensamiento y Cultura volumen 10, (2023): 173-195. DOI: http://dx.doi.org/10.31207/colloquia.v10i0.154
McCambridge, Jim., Witton, John y Elbourne, Diana, “Systematic review of the Hawthorne effect: New concepts are needed to study research participation effects”, Journal of Clinical Epidemiology 67, n.o. 3, (2014): 267-277, doi: 10.1016/j.jclinepi.2013.08.015.
Molinero, Luis, “La paradoja de Simpson”, Asociación de la Sociedad Española de Hipertensión, octubre del 2021, https://www.alceingenieria.net/bioestadistica/simpson.pdf
Mizrahi, Moti, “Historical Inductions: New Cherries, Same Old Cherry-picking”, International Studies in the Philosophy of Science, 29, n.o 2, (2015): 129-148, DOI:10.1080/02698595.2015.1119413
Mysore, Divakar., Khupat, Shrikant., y Jain, Shweta, “Understanding the architectural layers of a Big data solution”, IBM blog, 14 de octubre del 2013, https://developer.ibm.com/articles/bd-archpatterns3/
Nussbaumer, Cole, “Storytelling with data. A data visualization guide for business professionals”, New Jersey, Estados Unidos: John Wiley & Sons.
Nwammuo, Angela & Nwafor, Gideon, “How Online Newspaper Headlines Sway Opinion: Analysis of Online Newspaper Readership Patterns among Facebook Users”, International Journal of Informatics, Technology & Computers 5, n.o. 1, (2020): 1 – 10.
Pastor, Servando, “Alquimia: Cómo los datos se están transformando en oro”, Perfiles Económicos, n.o. 10, (2020): 173-177, http://doi.org/10.22370/pe.2020.10.2663.
Parusniková, Zuzana, “Popperian methodology and the Semmelweis case”, Medical Health Care and Philosophy 26, n.o. 4, (2023): 529–537. https://doi.org/10.1007/s11019-023-10167-7
Redacción, “70% de los hospitalizados por Covid-19 están vacunados”, aDiarioCR, 31 de enero del 2022, https://adiariocr.com/salud/70-de-los-hospitalizados-por-covid-19-estan-vacunados/
Sánchez, Óscar, “El Big data y su aplicación práctica en la estrategia de la empresa: Social Media Analytics”, Trabajo Final de Grado en Administración y Dirección de Empresas, Universidad Pontificia Comillas, 2019.
Scholl, Raphael, “Causal inference, mechanisms, and the Semmelweis case. Studies in History and Philosophy of Science”, 44, n.o. 1 (2013): 66–76. URL: https://www.sciencedirect.com/science/article/abs/pii/S0039368112000350
Sedwick, Philip y Greenwood, Nan, “Understanding the Hawthorne effect”, The BMJ: Endgames, (2015), https://doi.org/10.1136/bmj.h4672.
Singh y Shah, “Competency-based medical education and the McNamara fallacy: Assessing the important or making the assessed important?” Postgrad Med 69, n.o. 1 (2023):35-40. Doi: 10.4103/jpgm.jpgm_337_22.
Solano, Jonathan y Leiva, Estefany, “Big data Analytics: propuesta de una arquitectura”, 2014, San José, Costa Rica: ULACIT.
Soussi, Nisrrine y El Arass, Mohammed, “Data Cycle: From Big data to Smart Data”, Quinto congreso Internacional de IEEE, Marruecos: octubre del 2018.
Stanford Encyclopedia of Philosophy, Simpson’s Paradox, 21 de marzo del 2023, <https://plato.stanford.edu/archives/sum2021/entries/paradox-simpson/>.
Stöckl, Thomas., Jürgen, Huber., Kirchler, Michael y Lindner, Florian, “Hot hand and gambler's fallacy in teams: Evidence from investment experiments”, Journal of Economic Behavior & Organization, 117, (septiembre del 2015): 327-339, https://doi.org/10.1016/j.jebo.2015.07.004
Sujatha., Mayurnath, Reddy y Pooja, Pathak, “Camouflage in research – the hawthorne effect”. International Journal of Development Research, 09, n.o. 04, (2019): p. 26996-26999. ISSN: 2230-9926.URL: https://www.journalijdr.com/camouflage-research-%E2%80%93-hawthorne-effect
Tapia, Jeimy, “Macrodatos: almacenamiento y consulta de datos aplicados en las organizaciones”, Revista Ciencia administrativa, 2, 2022, ISSN 1870-9427.
Trianarts, “T. S. Eliot: El primer coro de la roca”, Trianarts blog, 12 de mayo del 2022, https://trianarts.com/acerca-de/#sthash.pG6DBi6R.dpbs
Valero, José, “La visualización de datos”, Revista Ámbitos, núm. 25, julio-diciembre 2014, https://www.redalyc.org/pdf/168/16832256009.pdf
Ventura, Dalia, “Qué es el "efecto cobra" (y cómo demuestra que a veces es peor el remedio que la enfermedad)”, BBC News Mundo, 21 de noviembre del 2020, https://www.bbc.com/mundo/noticias-54935306
Vigen, Tyler, “Spurious correlations”, s.f., https://www.tylervigen.com/spurious-correlations
Ying, Sue, “An Overview of Overfitting and its Solutions. Journal of Physics”, Conference Series 1168, n.o 2, 2019, doi:10.1088/1742-6596/1168/2/022022
Published
How to Cite
Issue
Section
Categories
License
Copyright (c) 2024 The National Administration Review
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Aquellos autores/as que tengan publicaciones con esta revista, aceptan los términos siguientes:
- Los autores/as conservarán sus derechos de autor y garantizarán a la revista el derecho de primera publicación de su obra, el cuál estará simultáneamente sujeto a la Licencia de reconocimiento de Creative Commons que permite a terceros compartir la obra siempre que se indique su autor y su primera publicación esta revista.
- Los autores/as podrán adoptar otros acuerdos de licencia no exclusiva de distribución de la versión de la obra publicada (p. ej.: depositarla en un archivo telemático institucional o publicarla en un volumen monográfico) siempre que se indique la publicación inicial en esta revista.
- Se permite y recomienda a los autores/as difundir su obra publicada en la revista a través de Internet (p. ej.: en archivos telemáticos institucionales o en su página web).