sábado, 26 de junio de 2010

La probabilidad de meter un gol

Para los últimos 4 grupos que se decidieron de la primera fase del mundial, yo dije que iba a predecir a los equipos que calificarían a la siguiente ronda. En total predije correctamente a 7 de los 8 equipos. Mis predicciones, anunciadas una hora antes de cada partido, fueron:
De los cuales todos fueron correctos excepto Italia, que fueron descalificados y pasó en su lugar Slovakia.

Ahora, ¿cómo le hice?

Pues todo empezó cuando, viendo los últimos partidos de esta primera ronda, quería tratar de sacar las combinaciones que los equipos tenían para calificar. Ya saben, esas que suenan como: “pasan si ganan, o también si empatan, pero en el otro partido X tiene que perder por más de n goles”. Me encontré con que es algo tedioso calcular estas combinaciones y, peor aún, cuando las obtienes suelen ser complicadas de expresar. Además, algunas de esas combinaciones (por ejemplo un empate) son mucho más probables que otras (ganar por 9 goles, y que en el otro partido X pierda). El hecho de que expresar las combinaciones sea complicado, junto con el hecho de que no siempre es claro cuales son más probables que otras, hace que se vuelva difícil estimar cuales son los equipos que tienen mayores posibilidades de calificar que otros.

Fue entonces que se me ocurrió la idea, ¿no será posible tratar de estimar esa probabilidad? ¿la probabilidad que cada uno de los equipos tiene de calificar?

Así, al final, en lugar de combinaciones complicadas de expresar y de entender, obtendríamos para cada equipo un número que nos dice, de todas esas raras combinaciones, en que porcentaje de ellas el equipo en cuestión logra pasar a la segunda fase del mundial. Algo mucho más sencillo de expresar, entender y comparar para saber quienes tienen más opciones.

Para poder estimar estos números antes también estimar que tan probables son los diferentes resultados de un partido, ¿0-0? ¿2-1? ¿7-3? ¿Qué tan probable es cada una de las combinaciones? Y antes de poder saber eso necesitamos contestar una pregunta aún más fundamental: ¿cuál es la probabilidad de meter un gol?

En particular nos interesa saber, ¿qué tantos goles se meten en un partido, y más o menos cuando? ¿Suelen meterse los goles en el primer tiempo? ¿En el segundo? ¿O es igual de probable meter un gol en cualquier minuto del partido? Y para poder contestarnos esta pregunta necesitamos de goles. Muchos goles.

Afortunadamente, Planet World Cup tiene un registro detallado de todos y cada uno de los partidos que se ha jugado en la historia del mundial. No sólo el resultado, sino en donde se jugó, los nombres de los jugadores, arbitros, si hubieron amonestados o expulsados y, lo que me interesaba a mi, exactamente en qué minuto se metieron cada uno de los goles.

Así que me bajé toda la información que tienen en ese sitio, y usando los datos de los mundiales desde 1966 hasta el 2006, donde se han jugado un total de 540 partidos y se han metido 1396 goles, me pude hacer el siguiente dibujito.


En este dibujito lo que estoy poniendo es cuantos goles ha anotado, en promedio, un equipo durante el transcurso de un partido. Pueden ver una linea prácticamente recta que va creciendo más o menos constantemente durante los 90 minutos del partido, donde cada equipo ha anotado en promedio 1.25 goles. En los tiempos extras, entre los 90 y 120 minutos, la linea continúa también subiendo más o menos recta aunque mucho más despacio (lo que suena lógico, pues no todos los partidos se van a tiempos extras).

Como chisme les comento que, aunque no es muy claro en el dibujo, la línea no es completamente recta. De hecho, durante los primeros 90 minutos de juego, la inclinación de la línea se va pronunciando más y más conforme pasa el tiempo. Para darse una idea, sólo el 40% de los goles se meten en el primer tiempo, mientras que el 60% caen en el segundo tiempo. Sin embargo, para nuestros fines va a ser suficiente con suponer que la linea es recta y que en promedio cada equipo mete 1.25 goles por partido.

El hecho de que la linea es recta nos dice también algo muy interesante: la probabilidad de meter un gol es más o menos la misma durante cualquier minuto del juego. Da lo mismo si el juego acaba de empezar, o si faltan pocos minutos para que termine, el chance que tiene un equipo de meter gol no varía demasiado.

Ahora, ya sabemos más o menos cuantos goles se meten en promedio por partido pero, ¿cuál es la probabilidad de meter un gol!? Para esto lo único que tenemos que hacer es desempolvar nuestro libro de proba donde encontramos que una fórmula de un tal señor Poisson hace el trabajo que queremos.

La distribución de Poisson [...] expresa la probabilidad de un número k de eventos ocurriendo en un tiempo fijo si estos eventos ocurren con una frecuencia media conocida y son independientes del tiempo discurrido desde el último evento.

¡Exacto, esa es la que queremos! ¡El numero k de eventos son los goles: 0 goles, 1 gol, 2 goles, etc, los que se anoten en un partido; el tiempo fijo son los 90 minutos de juego; y la frecuencia media son los 1.25 goles que ya conocemos! Ojo que Poisson también nos dice que los eventos tienen que ser independientes, lo cual en nuestro caso seguramente no es cierto (si te acaban de meter un gol, quizá le vas a echar más ganas para contraatacar), sin embargo vamos a suponer que son independientes pues eso nos da al menos una buena aproximación.

Así es como, preguntándole entonces al señor Poisson, obtenemos la probabilidad de que un equipo termine un partido con cierto número de goles anotados.

Goles:012345
Proba:28.54%35.79%22.43%9.37%2.94%0.74%

La tabla de hecho es infinita pero, como se imaginarán, a la derecha las probabilidades se van haciendo cada vez más y más pequeñas. Ahora, estos son los goles de sólo uno de los equipos, pero en cada partido juegan dos, y multiplicando estos números podemos estimar también la probabilidad de cada uno de los marcadores al final del partido.1

A/B012345
08.15%10.22%6.40%2.68%0.84%0.21%
110.22%12.81%8.03%3.35%1.05%0.26%
26.40%8.03%5.03%2.10%0.66%0.17%
32.68%3.35%2.10%0.88%0.28%0.07%
40.84%1.05%0.66%0.28%0.09%0.02%
50.21%0.26%0.17%0.07%0.02%0.01%

También una tabla infinita pero, como pueden ver, las probabilidades se van haciendo más y más insignificantes en los marcadores con muchos goles.

Y con esto tenemos ya realizada la mitad del trabajo, y la más interesante, para poder contestar nuestra pregunta inicial, que era ¿cuál es la probabilidad que cada equipo tiene de calificar a la siguiente ronda?

Para contestar esa pregunta lo que falta es sólo algo de talacha: hay que considerar cada uno de
los posibles marcadores de los últimos dos partidos de cada grupo (las opciones son infinitas, pero yo consideré sólo juegos hasta con 5 goles pues las probabilidades de las demás se vuelven insignificativas), y checar según los puntos que cada equipo lleva, sus resultados en los juegos anteriores, y las reglas de la FIFA para romper empates, quienes son los que califican.

Así es como, el miércoles por la noche, calculé las siguientes probabilidades.
  • Grupo E: Holanda (100%), Japón (63.05%), Dinamarca (36.20%), Camerún (0%)
  • Grupo F: Paraguay (82.79%), Italia (49.62%), Nueva Zelanda (39.83%), Slovakia (26.26%)
  • Grupo G: Brasil (100%), Portugal (99.99%), Costa de Marfil (0.000004%), Korea del Norte (0%)
  • Grupo H: Chile (88.18%), España (62.13%), Suiza (45.40%), Honduras (2.80%)
Y lo que hice fue en cada caso apostarle a los que tenían mayor probabilidad de calificar. Como pueden ver, la que me falló fue justamente la de Italia, donde el grupo estaba más cerrado y los cuatro equipos tenian posibilidades significativas de calificar.

Espero que les haya parecido interesante este post y al menos despertar su curiosidad por las cosas se pueden hacer aplicando algunos conceptos básicos de proba. Ya para terminar, y como lo había prometido, les dejo también cuatro predicciones para lo que falta del mundial.

  1. Por lo menos 3 partidos se van a ir a tiempos extra, de los cuales al menos 2 se van a decidir en penales.
  2. En uno de los partidos, que va a estar muy emocionante, se va a anotar un gol en los últimos 5 minutos del tiempo reglamentario (pasando el minuto 85).
  3. Van a haber por lo menos 3 grandes sorpresas: equipos de los que no se espera mucho les van a ganar a algunos que son más favoritos.
  4. Brasil no va a ganar el mundial. Lo siento, no este año.

A los interesados, también publiqué una predicción partido por partido, pero la verdad es que no le tengo mucha ‘fe’ a esa. :P


1. Para hacer esto de nuevo hay que suponer que los eventos son independientes, que los goles que tú metes no dependen de los que mete el oponente, lo cual seguramente también es falso. Pero de nuevo podemos suponer que sí son independientes y obtener al menos una aproximación.

6 comentarios:

Rafael Peñaloza dijo...

nos quieres hacer trampa con esas predicciones tan genéricas...
:P

Juan dijo...

Ok, no quería, pero ya puse una serie de predicciones directas para los partidos que faltan. Ahora tienes que poner la tuya! :P

Rafael Peñaloza dijo...

A ver, eso es un reto...
En parte estoy haciendo trampa porque Uruguay ya va ganando 1-0, pero ahí va:

octavos:
ganan uruguay, eeuu, holanda, brasil, argentina, alemania, paraguay, espanha (casi igual a la tuya, excepto por espanha)

cuartos:
eeuu, brasil,alemania, espanha

semifinal:
brasil, espanha

final: brasil

tercero: alemania

es basicamente igual a la tuya, mi único cambio es espanha por portugal ;)... veamos.

Y para quitar la emocion al asunto: cómo lo decidí? Directamente, comparación según ranking de FIFA.

Juan dijo...

Ah que ganas de quitarle la emoción! No, yo use un método mucho más ingenioso, pero ya lo platico al final del mundial. :P Suerte!

andres dijo...

aja, esta bien, me puedes decir los siguientes resultados para apostarle a las quinielas? eso ayudaría a mi economía :P

Juan dijo...

Andrés, hmm, te puedo decir los resultados ahora. ¿sirve? :P