Le prédictif, est-ce que ça marche ?
Afin de valider la carte prédictive « réplique sismique » de MAP REVELATION®©, réalisée à partir de l’adaptation d’un algorithme utilisé pour la prédiction de répliques sismiques et inspiré des travaux mathématiques sur l’algorithme de type « self exciting point », une étude a été menée sur des historiques de faits réels.
Ces cartes sont réalisées en fonction de périodes de
références, et analysent la contigüité des faits dans
l’espace, croisée avec les analyses de récurrences dans le
temps. Le tout est visualisé sous forme d’une carte de
prédiction de type heatmap, pour les 24 heures suivant la
période de référence.
Avec MAP REVELATION®©, on obtient le type de
carte suivante, dans laquelle les zones bleues, d’un
diamètre d’environ 600 mètres dans cet exemple,
désignent les endroits où il y a le plus de
probabilité de récurrence de faits dans les 24 heures suivant
la période de référence :
A noter la différence avec les cartes de densité heatmap , ou de hotspots :
Étude
Pour valider l’algorithme, nous
avons donc procédé à l’étude suivante :
La base de données utilisée
contient les enregistrements de faits spatiotemporels réels
(cambriolages, délit de voie publique etc…) sur une année
sur la ville A.
Compte tenu de la nature des faits, nous sommes partis sur l’hypothèse que ces faits pouvaient suivre des récurrences soit sur les huit derniers jours, soit de jour dans la semaine (lundi, mardi…).
Nous avons donc réalisé une
première carte de type « sismic » en sélectionnant
l’ensemble des faits de cambriolage des huit jours
précédents les faits à prévoir.
Puis une deuxième carte
est réalisée à partir des faits enregistrés le même jour de
la semaine sur les 4 semaines antérieurs aux faits à
prévoir.
Ces deux cartes sont superposées et visualisées (Pour des soucis de confidentialité et de visibilité, le fond de carte à été remplacé par un fond blanc) :
Afin de vérifier l’efficacité de
l’algorithme, on juxtapose ensuite la carte des faits avérés
dans les 24h suivants la période de référence :
On compte ensuite le nombre de faits
avérés inclus dans les zones prédites.
En réalisant la
même manipulation sur huit jours glissant, on obtient les
résultats suivants :
|
Nbre de faits totaux avérés le jour à prédire |
nombre de faits prédits
(sur carte même jour sur 4 semaines précédentes) |
nombre de faits prédits
(sur carte semaine précédente) |
Total prédits (sans recouvrements) |
total de faits
prédits % |
lundi |
53 |
11 |
9 |
20 |
38% |
mardi |
41 |
2 |
10 |
12 |
29% |
mercredi |
52 |
3 |
8 |
11 |
21% |
jeudi |
69 |
18 |
15 |
26 |
38% |
vendredi |
59 |
11 |
11 |
16 |
27% |
samedi |
46 |
4 |
7 |
10 |
22% |
dimanche |
34 |
4 |
5 |
9 |
26% |
TOTAL |
354 |
53 |
65 |
104 |
29% |
On constate que la carte prédit entre 1 fait sur 5 et 2 faits sur 5 environ.
D’autres tests ont été réalisés
sur d’autres bases de données réelles :
Base 2, cambriolages, autre ville,
faits totaux sur la période 56, 50% des faits avérés prédits :
Base 3, vol à la tire, autre
ville, 32% de faits prédits :
Conclusion
La carte « réplique
sismique » testée sur des bases de données d’historique réel
parvient à prédire, avec une précision de 500 à 1000 mètres,
entre 20% et 50% des faits du lendemain de la période de
référence de la recherche.