|
|
Calentando el auto
Llega esta época del año en que me encuentro frente al televisor, mirando partidos de fútbol americano. ¿Alguien más advirtió la importante explosión de información estadística que se inmiscuyó en los deportes televisados?
Si alguna vez tuvo oportunidad de ver la repetición de una contienda deportiva clásica, digamos de hace 10 años, es claro que la calidad y cantidad de información que se muestra hoy en la pantalla, conjuntamente con la el juego en sí aumentó considerablemente. Los programas de deportes actuales tienden a desarrollarse dentro de una pequeña ventana de nuestra pantalla, y están enmarcados con graficas que se refieren a los corredores de bases, los totales de cantidad de yardas ganadas y las actualizaciones de resultados. Todo tiene sentido, supongo, ya que la audiencia actual creció acostumbrada a los sistemas operativos de las computadoras con diseño de ventanas (Windows) e incluso monitores de resolución aún mayor (¿alguien recuerda el Windows 95 en monitores de resolución de 640x480 pixels?). De todos los argumentos que pienso a favor de comprar el “HDTV extravagante (término técnico)”, ver deportes está entre los de más fácil defensa: “¡Querida, no puedo descifrar el contenido del conteo de pitches en tamaño de letra de 6 puntos en nuestra magra pantalla de 34 pulgadas!”
Máquinas de conocimiento profundo del deporte. Para alimentar todas estas estadísticas llamativas, sólo me aventuro a pensar que usan tecnología de procesamiento analítico online (Online Analytical Processing –OLAP) para mantener todos los datos en orden. OLAP es básicamente un enfoque de data-warehousing que “pre-calcula” cada combinación aritmética o algebraica de números posible en una base de datos para que luego estén listos para informar o ayudar en la toma de decisiones. Dicho de otro modo, esto puede permitirle a los relatores contar con la capacidad de seleccionar rápidamente las palabras “MARTES” “A LA NOCHE”, “ZURDOS” “KONERKO” y “PROMEDIO DE BATEO” y sonar como súper-humanos en el aire cuando dicen: “Sabes Pete… Konerko batea .292 cuando se enfrenta a pitchers zurdos los martes por la noche.”
La máquina de “conocimiento profundo espontáneo”. Sería interesante construir urna aplicación sobre un sistema OLAP que automáticamente busque estadísticas de situación que cumplan algunos “umbrales interesantes”: Lo que quiero decir es lo siguiente: en el ejemplo precedente, me imaginaba a los relatores seleccionando los atributos para determinar el promedio de bateo del jugador. Sería interesante invertir el escenario, y preguntarle a la base de datos: “¿Qué situaciones colocaron las estadísticas de este jugador en una perspectiva interesante?”. Interesante se podría definir objetivamente como el promedio de bateo superior a .400, ERA (Earned Run Average: la cantidad promedio de corridas cedidas por el pitcher cada nueve innings) inferior a 1.0 o similar. De este modo, los factores estadísticos más interesantes podrían aparecer automáticamente para un jugador sin ninguna intervención humana.
La máquina del “Repunte”. Si alguna vez vieron un juego de póker televisado, probablemente vieron las gráficas generadas en pantalla mostrando la probabilidad de cada jugador de ganar dadas sus cartas actuales. A medida que piden cartas nuevas, sus probabilidades de ganar cambian para reflejar la nueva situación. Esto funciona muy bien en el póker porque los estados del juego son finitos y fortuitos (o dicho de otro modo: se conocen todas las posibles distribuciones de cartas, con lo cual las probabilidades de ganar pueden calcularse directamente). A diferencia del póker, los eventos en deportes tales como el baseball y football americano son altamente variables, incluso caóticos.
A pesar de esto, asumiendo que nuestro data warehouse contenía información histórica de puntajes, podríamos realizar análisis para determinar la probabilidad simple de ganar de cada equipo en base a información histórica.
Un ejemplo que nos puede ayudar a comprender la situación: los Eagles de Filadelfia están venciendo a los Falcons de Atlanta 23 a 10 y faltan siete minutos en el último cuarto. Conociendo el lago historial de datos de puntajes de juegos de football americano profesional, nuestro sistema descubre que los equipos que pierden por 13 puntos cuando faltan 7 minutos sólo tienen una probabilidad de ganar del 18%. Al cabo de otro minuto, el sistema nos indica que las probabilidades de revertir la situación se reducen -históricamente hablando- a un 13%. Los Falcons anotan durante ese minuto y el estado del juego cambia de (13 puntos/6 minutos) a (6 puntos/6 minutos). Nuestro sistema cambia las oportunidades históricas de ganar, incrementándolas al 30%.
Creo que esta “probabilidad de ganar en tiempo real” sería muy interesante de ver como factores en pantalla. Podría ser incluso más valiosa en el estadio, ayudando a decidir más fácilmente cuando irse temprano y empezar a calentar el auto para ganarle al tránsito….
“Salgamos de aquí querida… El partido está un 98.8% terminado”.
|
|
|
|
February 2007
|