BIG DATA en las aulas: llegó el momento.
01 de noviembre, 2024
En los 90s en la preparatoria recuerdo haber tenido mi primer contacto con la estadística, apenas fue un destello interesante. Luego durante los 2000s tuve mi segundo encuentro en la universidad, una materia que se basaba en el libro de Estadística Elemental de Mario F. Triola. Cambió mi perspectiva sobre el poder de los datos.
En aquellos tiempos, el cómputo universitario era limitado a los sistemas de Microsoft® Windows 2000 y XP, además de herramientas de estadística para fines educativos. Recuerdo haber observado tres entornos que como joven eran parte de mi día: la comunidad universitaria, el deporte acuático de la natación y cierto gusto por la economía.
Sobre el deporte decidí generar un histórico de tiempos de cada una de las personas que practicaban este deporte en competencias deportivas a nivel local, regional y nacional. Es necesario mencionar que este histórico genera datos relacionados a la edad, género, fechas de nacimiento, categoría, grupo o equipo, procedencia o localidad, teléfonos, correos electrónicos y selección de modalidades (este refiere a la selección de distancias y estilos existentes en la natación). De este último dato, se duplica debido a que se hace un tiempo de inscripción y luego de finalizada la competencia, se crea el tiempo resultante. De tal manera que si una persona o atleta, registra 8 modalidades, al final acumulará 16 registros. Me fascinaba pensar en la cantidad de datos generado por cada competencia, cada una en un tamaño pequeño se registran 250 personas, un mediano 500 personas y una grande arriba de 1,000. Emprendí con entusiasmo al procesar datos de tal manera que surgían tendencias de tiempos y mejoras, rango y diferencia de tiempos entre los participantes más rápidos y los más lentos, pertenencia de los atletas con mayor mejora respecto de ediciones pasadas, cantidad de participantes por edición, etc., sin embargo, era una labor hecha con una computadora con apenas un procesador Intel® Pentium IV eventualmente había cierto colapso en el procesamiento de los datos. Gracias a esta tarea personal se logró innovar de forma local el sistema de entrenamiento, colocar a varios nadadores debajo de los 40 más rápidos del mundo y sobre todo una cultura de medición y objetivos específicos, la natación es un deporte de precisión.
Luego de varios ejercicios, llegué a la conclusión de que el universo de los datos siempre está esperando, meses después llegó una nueva generación de empresas y personas que dieran valor a estos en distintos niveles y sectores, surgieron muchas marcas justo al inicio del siglo XXI (Google, Facebook, Maps, Paypal, etc..) enfocadas en los usuarios comunes para establecer un nuevo paradigma (B2C) y con ello, la nueva riqueza de los datos.
Hoy 20 años después los procesadores son significativamente capaces y se facilita con tecnología en la nube. En pleno 2024, ya no existe la limitación del cómputo, sin embargo, aparecen tres retos en las aulas mexicanas, el primero es fomentar la conciencia, es decir, aprender a encontrar los datos, segundo implementar los mecanismos para atraparlos y tercero plantear las preguntas correctas para resolver problemas a través de la ciencia de datos.
La conciencia consiste en darle su justo valor al dato, cada proceso, cada persona, cada transacción, cada trayecto, cada insumo, cada mecanismo que genera datos con la potencial posibilidad de ser usados. Si esto no existe los datos se reducen a cero.
La implementación de los mecanismos, me refiero a los procesos de sistemas computacionales, electrónicos o de automatización simples o complejos que nos ayudan a distintos objetivos y que cómo parte de su fin, incluye los datos. Aunado a lo anterior existen otros mecanismos manuales o semi automáticos, sin embargo, en muchos otros ámbitos inexistentes. Los mecanismos dependen de la madurez por la información.
Las preguntas, es saber plantear lo que se desea saber, descubrir, mejorar o innovar que están relacionadas a la madurez que una persona, grupo o entidad tiene sobre la información generada, es decir, luego de captar y cuestionar, usar y tener beneficios de los datos.
Enseñar a generar proyectos de gestión de datos aprovechando los flujos derivados de una adopción creciente en la era de la digitalización, y entenderlo como una evolución de los proyectos y la toma de decisiones son rasgos de esta era del conocimiento.
En las aulas de la Universidad Anáhuac Puebla, se estudian casos de gestión de datos y su implementación, formando a los futuros líderes para tomar decisiones informadas en escenarios de alta presión. Asignaturas como Ciencia de Datos, en programas como la maestría en Big Data e Inteligencia Artificial, ofrecen las herramientas clave para enfrentar estos desafíos con visión estratégica y precisión, elementos esenciales en una era guiada por los datos.
Abraham Bermejo Castillo