- Las instituciones de educación deben brindar, promover y divulgar información sobre este concepto, señaló el académico de la Facultad de Estadística e Informática
Paola Cortés Pérez
Xalapa, Ver.- Mario Miguel Ojeda Ramírez, profesor-investigador de la Facultad de Estadística e Informática (FEI) de la Universidad Veracruzana (UV), comentó que las instituciones de educación deben brindar, promover y divulgar información sobre lo qué es el big data pues crecerá mucho en los próximos años y se convertirá en un área de oportunidad para todos los profesionistas.
El académico ofreció la charla “La estadística y la ciencia de datos”, como parte de las actividades del programa “Tardes de Ciencia”, impulsado por la Dirección General de Investigaciones (DGI) de esta casa de estudios y que concluye el 6 de julio.
Mencionó que en los últimos años se ha puesto de moda la ciencia de datos, ahora se habla de un científico de los datos, de big data, de la minería de datos, generándose un movimiento mundial.
Explicó que la ciencia de datos es una amalgama de tres cosas: matemáticas y estadística, ciencias e ingeniería de cómputo, y conocimiento del campo en donde se presenta el problema.
El big data es la “colecta datos, lo prepara y los explora, para luego representarlos y transformarlos, a fin de encontrar patrones y modelar cosas; asimismo, visualiza y presenta los datos para que sean fácilmente interpretados, para que ayuden al análisis y toma de decisiones para los problemas.”
En tanto, la minería de datos es un área mixta de la computación y la estadística; primero se aplicó en astronomía y física experimental, donde se generan volúmenes inmensos, masivos y densos de datos.
“Se usaban algoritmos que permitieran hacer agrupaciones, segmentaciones e identificar patrones, para ello se utilizaron técnicas de la estadística y algoritmos computacionales.”
Sin embargo, dijo que es necesario desarrollar nuevas competencias para participar en el proceso de la minería de datos porque han surgido temas nuevos: calidad de los datos y sesgos de selección, algoritmos computacionales, programación, machine learning, técnicas de minería de datos, trabajo en equipo, multidisciplina, proactividad, esquemas de selección, poder de inferencia, etcétera. Todo esto se demanda actualmente de quien es científico de los datos.
Y la estadística, mencionó, ha sido una disciplina que brinda principios, procedimientos y técnicas para colectar datos, analizarlos y difundir correctamente el conocimiento obtenido en la toma de decisiones.
Actualmente esta disciplina se desarrolla en tres fases: diseño del estudio o investigación, diseño y verificación de la base de datos, e implementación de la estrategia de análisis de datos y presentación de resultados.
Por último, resaltó que el big data brinda oportunidades y plantea retos para todas las profesiones y disciplinas, de tal manera que todos los espacios educativos deben brindar, promover y divulgar qué es, al ser un fenómeno impulsado por un mercado especializado en la explotación de datos masivos.
“Según las previsiones, en los próximos años crecerá muchísimo, siendo una gran área de oportunidad para todos los profesionales que tengan relación con el científico de datos.”
Por último, subrayó que la investigación de la ciencia de datos tiene mucho por hacer, las orientaciones de la investigación cambiarán mucho en las próximas décadas.
“Hoy en día, los proyectos de investigación deben ser de alta incidencia, lo que significan más datos, a lo que están llamadas la estadística y la informática.”