Bonjour,
Je travaille également dans ce domaine (recherche / data science) et j’ai plusieurs fois eu envie de faire tourner quelques algorithme d’apprentissage sur des données de sport !
Comme très souvent, on possède de bons algorithmes mais on se heurte aux problèmes des données (qualité vs quantité,…)
Côté kikourou, une chose sympa que l’on pourrait assez facilement mettre en place serait un « prédicteur » de performance (estimation de temps, à priori, sur une course) avec un algorithme des K-NN voisins suivi d’une simple régression linéaire.
En gros, pour un trail donné auquel un coureur C1 participe pour la première fois, on regarde qui sont les personnes qui ont déjà participé à ce trail et qui ont également déjà participé à d’autres trail commun avec le coureur C1. Grace à toutes ces infos, on peut « prédire » le temps moyen du coureur C1 sur le futur trail qu’il va faire.
Sinon, autre idée qu’on pourrait également faire avec la base de données de kikourou, c’est un «clustering - classement » des trails par difficulté de manière "objective". Dans ce cas précis, je verrais bien un réseau de neurones à apprentissage non supervisé de type carte auto-adaptative de Kohonen (comme ça la subjectivité de l'être humain n'intervient pas en amont !). En entrée du réseau on fournit la liste de toutes les courses selon le vecteur [distance; D+; D-; temps moyen des 5 premiers].
Le réseau pourra ensuite construire des « groupes » de courses semblables qui engloberont également des notions plus « subjective » de difficulté du terrain,… qui sont toujours difficiles à appréhender d'un point de vu humain.
Ce genre de résultat pourrait, à terme, être réinjecter dans le premier algo de « prévision » de performance pour un coureur donné. Plus besoin d’avoir fait exactement les mêmes courses que ces "K plus proches voisins" pour estimer un temps. Il suffit maintenant d’avoir en commun une course classé dans le même groupe de difficulté…
Voilà, pour des idées d’exploitation des data de kikourou (des motivés

?)
Par contre pour arriver à faire de l’optimisation d’entraînement individualisé, je pense qu’on en est encore loin...
Dans ce domaine, il ne faut jamais oublier que pour fonctionner, n’importe quel algorithme a besoin d’énormément de données si elles sont bruités (des 10zaines de millions) ou de beaucoup moins si elles sont très très propres (certain réseau de neurones tournent avec 500 exemples d’apprentissages seulement) et que d’un point de vue du sportif en milieu extérieur, c’est rare d’avoir des données propres (la météo, le sommeil, la nourriture, les chaussures, bref tout peut venir « bruité » les data) et, dans le cas contraire (données bruités), c’est rare d’avoir des millions d’exemples à notre disposition !