Exploring Logical Challenges in Data Visualization and Analysis in Big data Architectures: A Focus on Fallacies, Biases, and Paradoxes

Exploring Logical Challenges in Data Visualization and Analysis in Big data Architectures: A Focus on Fallacies, Biases, and Paradoxes

Authors

DOI:

https://doi.org/10.22458/rna.v15i1.5150

Keywords:

Big data, fallacies, biases, paradoxes, data analysis

Abstract

In this qualitative research, an identification and characterization of some of the main logical errors made when analyzing and visualizing data in Big Data architectures are conducted through a documentary and bibliographic review. It is worth noting that errors are systematized considering three categories: fallacies, biases, and paradoxes. The article aims to serve as guidance for individuals engaged in these tasks in both public and private sectors. Additionally, it provides insight into research lines related to epistemology and ethics in Big Data.

References

Atkins, Hazel, “Raising "The Rock": The Importance of T. S. Eliot's Pageant-Play”. Christianity and Literature, 62, n.o 2 (2013): 261- 282. https://doi.org/10.1177/014833311306200.

Barrantes, Rodrigo, “Investigación: un camino al conocimiento”, San José, Costa Rica: EUNED, 2016.

Borge, Bruno, “Realismo científico hoy: a 40 años de la formulación del Argumento del No-Milagro”. Revista Acta Scientiarum 37, n.o 2 (julio, 2015): 221-233. URL: http://www.redalyc.org/articulo.oa?id=307343306010.

Brooks, David, “The Philosophy of Data”, New York Times, 4 de febrero del 2013, edición en español, https://www.nytimes.com/2013/02/05/opinion/brooks-the-philosophy-of-data.html

Camargo-Vega, Juan., Camargo-Ortega, Jonathan., y Joyanes-Aguilar, Luis. “Conociendo Big data”. Revista de la Facultad de Ingeniería, 24, n.o 38(enero-junio 2015): 63-77, http://www.redalyc.org/articulo.oa?id=413940775006

Cerdas, Mónica, “Lotería Navideña: estos son los números que nunca han salido con el premio mayor”, El Financiero, 16 de diciembre del 2023, https://www.elfinancierocr.com/finanzas/loteria-navidena-estos-son-los-numeros-que-nunca/WGMMVS5TWZEH5CLRIW5YQ5CZPU/story/

Chen, Andrew, “DAU/MAU is an important metric to measure engagement, but here’s where it fails”., @andrewchen, s.f, https://andrewchen.com/dau-mau-is-an-important-metric-but-heres-where-it-fails/

Data Heroes, Noise in Machine Learning, Data Heroes blog, s.f, https://dataheroes.ai/glossary/noise-in-machine-learning/

Diebold, Francis, “On the Origin(s) and Development of the Term Big data”, PIER Working Paper n.o 12-037, septiembre 2012, https://dx.doi.org/10.2139/ssrn.2152421

Drayson, Matthew y Bashir, Amjad, “The Evolution of Data Management: A Practitioner Perspective”, https://www.dimensiondata.com/-/media/ntt/global/solutions/intelligent-business/intelligent-business-landing-page/evolution-of-data-management-ebook.pdf

Dykes, Brent, “A History Lesson On The Dangers Of Letting Data Speak For Itself”, Forbes, 9 de febrero del 2016, https://www.forbes.com/sites/brentdykes/2016/02/09/a-history-lesson-on-the-dangers-of-letting-data-speak-for-itself/?sh=7aed8c9d20e1

Elston, Dirk, “Survivorship Bias”, Journal of the American Academy of Dermatology, (2021), https://doi.org/10.1016/j.jaad.2021.06.845

Felton, James, “How A Helmet And A Bullet-Riddled Plane Perfectly Demonstrates Survivor Bias”, IFL Science, 14 de septiembre del 2021, https://www.iflscience.com/how-a-helmet-and-a-bulletriddled-plane-perfectly-demonstrates-survivor-bias-60930

García, Yamileth y Pérez, Yolanda, “Aplicación del discurso teórico en diversos espacios de la realidad social: un acercamiento sociológico entre actores sociales”, Revista Abra, 42, n.o. 65 (2022): 83-96, https://doi.org/10.15359/abra.42-65.5

Gupta, Vipin., Saini, Chhavi., Oberoi, Meher., Kalra, Gagan., y Imran, Nasir, “Semmelweis Reflex: An Age-Old Prejudice”, World Neurosurgery, 136 (2020): e119-e125, https://doi.org/10.1016/j.wneu.2019.12.012.

Hernández-Leal, Emilcy., Duque-Méndez, Néstor y Moreno-Cadavid, Julián, “Big data: una exploración de investigaciones, tecnologías y casos de aplicación”, TecnoLógicas 20, n.o 29, (2017): 17-24, http://www.scielo.org.co/scielo.php?pid=S0123-77992017000200002&script=sci_arttext

IBM, “Understanding the architectural layers of a Big data solution”, IBM blog, 15 de octubre del 2013, https://developer.ibm.com/articles/bd-archpatterns3/

Manterola, Carlos y Otzen, Tamara, “Los Sesgos en Investigación Clínica”, International Journal of Morphology 33, n.o. 3, (2015): 1156-1164, URL: https://www.scielo.cl/scielo.php?pid=S0717-95022015000300056&script=sci_arttext&tlng=pt.

Márquez, Jairo, “Inteligencia artificial y Big data como soluciones frente a la COVID-19”, Revista de Bioética y derecho. No.50, (2020): 315-331, https://scielo.isciii.es/scielo.php?pid=S1886-58872020000300019&script=sci_arttext

Martén, Sergio. “El problema epistemológico de los Big data en la producción de conocimiento científico”. Tesis de Maestría en Filosofía (2023). Universidad de Costa Rica.

Martínez, Sergio, “La navaja de Ockham y la heterogeneidad de las representaciones: hacia una ontología de lo abstracto”, Azafea Revista de filosofía 12, n.o. (2011):97-118, https://doi.org/10.14201/7999.

Martino, Silvia, “Repensar la empresa, la persona y el trabajo: Elton Mayo y algunos aportes antropológicos de Leonardo Polo”, Revista de Pensamiento y Cultura volumen 10, (2023): 173-195. DOI: http://dx.doi.org/10.31207/colloquia.v10i0.154

McCambridge, Jim., Witton, John y Elbourne, Diana, “Systematic review of the Hawthorne effect: New concepts are needed to study research participation effects”, Journal of Clinical Epidemiology 67, n.o. 3, (2014): 267-277, doi: 10.1016/j.jclinepi.2013.08.015.

Molinero, Luis, “La paradoja de Simpson”, Asociación de la Sociedad Española de Hipertensión, octubre del 2021, https://www.alceingenieria.net/bioestadistica/simpson.pdf

Mizrahi, Moti, “Historical Inductions: New Cherries, Same Old Cherry-picking”, International Studies in the Philosophy of Science, 29, n.o 2, (2015): 129-148, DOI:10.1080/02698595.2015.1119413

Mysore, Divakar., Khupat, Shrikant., y Jain, Shweta, “Understanding the architectural layers of a Big data solution”, IBM blog, 14 de octubre del 2013, https://developer.ibm.com/articles/bd-archpatterns3/

Nussbaumer, Cole, “Storytelling with data. A data visualization guide for business professionals”, New Jersey, Estados Unidos: John Wiley & Sons.

Nwammuo, Angela & Nwafor, Gideon, “How Online Newspaper Headlines Sway Opinion: Analysis of Online Newspaper Readership Patterns among Facebook Users”, International Journal of Informatics, Technology & Computers 5, n.o. 1, (2020): 1 – 10.

Pastor, Servando, “Alquimia: Cómo los datos se están transformando en oro”, Perfiles Económicos, n.o. 10, (2020): 173-177, http://doi.org/10.22370/pe.2020.10.2663.

Parusniková, Zuzana, “Popperian methodology and the Semmelweis case”, Medical Health Care and Philosophy 26, n.o. 4, (2023): 529–537. https://doi.org/10.1007/s11019-023-10167-7

Redacción, “70% de los hospitalizados por Covid-19 están vacunados”, aDiarioCR, 31 de enero del 2022, https://adiariocr.com/salud/70-de-los-hospitalizados-por-covid-19-estan-vacunados/

Sánchez, Óscar, “El Big data y su aplicación práctica en la estrategia de la empresa: Social Media Analytics”, Trabajo Final de Grado en Administración y Dirección de Empresas, Universidad Pontificia Comillas, 2019.

Scholl, Raphael, “Causal inference, mechanisms, and the Semmelweis case. Studies in History and Philosophy of Science”, 44, n.o. 1 (2013): 66–76. URL: https://www.sciencedirect.com/science/article/abs/pii/S0039368112000350

Sedwick, Philip y Greenwood, Nan, “Understanding the Hawthorne effect”, The BMJ: Endgames, (2015), https://doi.org/10.1136/bmj.h4672.

Singh y Shah, “Competency-based medical education and the McNamara fallacy: Assessing the important or making the assessed important?” Postgrad Med 69, n.o. 1 (2023):35-40. Doi: 10.4103/jpgm.jpgm_337_22.

Solano, Jonathan y Leiva, Estefany, “Big data Analytics: propuesta de una arquitectura”, 2014, San José, Costa Rica: ULACIT.

Soussi, Nisrrine y El Arass, Mohammed, “Data Cycle: From Big data to Smart Data”, Quinto congreso Internacional de IEEE, Marruecos: octubre del 2018.

Stanford Encyclopedia of Philosophy, Simpson’s Paradox, 21 de marzo del 2023, <https://plato.stanford.edu/archives/sum2021/entries/paradox-simpson/>.

Stöckl, Thomas., Jürgen, Huber., Kirchler, Michael y Lindner, Florian, “Hot hand and gambler's fallacy in teams: Evidence from investment experiments”, Journal of Economic Behavior & Organization, 117, (septiembre del 2015): 327-339, https://doi.org/10.1016/j.jebo.2015.07.004

Sujatha., Mayurnath, Reddy y Pooja, Pathak, “Camouflage in research – the hawthorne effect”. International Journal of Development Research, 09, n.o. 04, (2019): p. 26996-26999. ISSN: 2230-9926.URL: https://www.journalijdr.com/camouflage-research-%E2%80%93-hawthorne-effect

Tapia, Jeimy, “Macrodatos: almacenamiento y consulta de datos aplicados en las organizaciones”, Revista Ciencia administrativa, 2, 2022, ISSN 1870-9427.

Trianarts, “T. S. Eliot: El primer coro de la roca”, Trianarts blog, 12 de mayo del 2022, https://trianarts.com/acerca-de/#sthash.pG6DBi6R.dpbs

Valero, José, “La visualización de datos”, Revista Ámbitos, núm. 25, julio-diciembre 2014, https://www.redalyc.org/pdf/168/16832256009.pdf

Ventura, Dalia, “Qué es el "efecto cobra" (y cómo demuestra que a veces es peor el remedio que la enfermedad)”, BBC News Mundo, 21 de noviembre del 2020, https://www.bbc.com/mundo/noticias-54935306

Vigen, Tyler, “Spurious correlations”, s.f., https://www.tylervigen.com/spurious-correlations

Ying, Sue, “An Overview of Overfitting and its Solutions. Journal of Physics”, Conference Series 1168, n.o 2, 2019, doi:10.1088/1742-6596/1168/2/022022

Published

2024-06-30

How to Cite

Zárate-Sánchez, R. (2024). Exploring Logical Challenges in Data Visualization and Analysis in Big data Architectures: A Focus on Fallacies, Biases, and Paradoxes. The National Administration Review, 15(1), e5150. https://doi.org/10.22458/rna.v15i1.5150
Loading...