@misc{10481/73877, year = {2021}, month = {12}, url = {http://hdl.handle.net/10481/73877}, abstract = {There are two main goals of this work: 1) to compare different statistical models, which are applied to historic tournaments to find a suitable statistical model, i.e. the model with the best predictive performance, and 2) to understand which factors are important for good predictions. Every year at least one of four important recurring table tennis tournaments takes place where top players compete. Those tournaments are the World Table Tennis Championships, the Table Tennis World Cup, the Olympic Games and the ITTF World Tour. In other areas of sports, it is common to analyse major tournaments and predict future ones. This work aims to bring this aspect of analysis to the world of table tennis by evaluating recent holdings of the Men’s World Cup and the Grand Finals of the Men’s ITTF World Tour. The results show that it is indeed possible to apply statistical machine learning methods on table tennis tournaments for prediction with a correct classification rate of around 75% by a random forest and 74% by a penalized generalized linear logit model. Even though both models based their predictive power mainly on the official table tennis rankings and points, variables like age, playing handedness or individual strength were important factors as well.}, abstract = {Este trabajo tiene dos objetivos principales: 1) comparar los diferentes modelos estadísticos que se aplican a torneos históricos para encontrar un modelo estadístico adecuado, es decir, el modelo con el mejor rendimiento predictivo, y 2) entender cuáles factores son importantes para una buena predicción. Cada año se celebra al menos uno de los cuatro torneos importantes y recurrentes de tenis de mesa en los que compiten los mejores jugadores. Esos torneos son el Campeonato Mundial de Tenis de Mesa, la Copa del Mundo de Tenis de Mesa, los Juegos Olímpicos, y el Circuito Mundial de Tenis de Mesa. En otras áreas del deporte, es común analizar torneos importantes y predecir los futuros. Este trabajo pretende traer ese aspecto del análisis al mundo del tenis de mesa al evaluar las competencias recientes en la Copa del Mundo y las Grandes Finales del Circuito Mundial, ambas en la categoría masculina. Los resultados demuestran que es posible aplicar métodos estadísticos de aprendizaje automático a los torneos de tenis de mesa para predecir con una tasa de clasificación correcta de alrededor del 75% a través de un bosque aleatorio y del 74% con un modelo logit lineal generalizado penalizado. Aunque ambos modelos basan su poder predictivo principalmente en las clasificaciones oficiales de tenis de mesa y puntos, las variables como la edad, la destreza en el juego o la fuerza individual también fueron factores importantes.}, keywords = {tournament analysis}, keywords = {random forest}, keywords = {statistical learning}, keywords = {table tennis}, keywords = {LASSO regression}, keywords = {análisis de torneo}, keywords = {bosque aleatorio}, keywords = {aprendizaje estadístico}, keywords = {tenis de mesa}, keywords = {regresión LASSO}, title = {Predicting Table Tennis Tournaments: A comparison of statistical modelling techniques}, doi = {10.30827/Digibug.73877}, author = {Lennartz, Jan and Groll, Andreas and van der Wurp, Hendrik}, }