Se connecter
Date limite de participation :
16 janvier 2017

Prédiction de la demande en fioul domestique

L’objectif de ce challenge est de prédire à la maille temporelle la plus fine possible la demande des clients.

Classement
1. (1) Etienne Fayet Score 1,492658
2. (2) SEMMAU Denis Score 1,706552
3. (3) Arnaud Chanoine Score 1,802148
Ce challenge est terminé.

231

contributions

80

participants

terminé
terminé

Les filiales Combustibles du Groupe en France distribuent du fioul domestique principalement pour le chauffage de résidences ou de locaux professionnels. Elles assurent l'ensemble de la chaîne commerciale et logistique de cette activité : marketing de l'offre, pricing, relations clients, prises de commandes et organisation des livraisons. Dans un contexte de sobriété énergétique et d'une concurrence accrue d'acteurs online, nos filiales Combustibles s'efforcent constamment d'optimiser leurs moyens et d’améliorer leur compétitivité.

Le challenge consiste à concevoir un modèle de prédiction de la demande en fioul domestique. Ce modèle sera évalué sur la première quinzaine du mois de décembre 2015.

En construisant un modèle mathématique permettant de prédire à la maille temporelle la plus fine possible le nombre de commandes des clients, vous aiderez les filiales Combustibles du Groupe à optimiser les plannings des équipes, à ajuster leur politique de prix ou encore rendre leurs campagnes marketing plus impactantes...

Les données mises à disposition :

  • L'historique des commandes au niveau détaillé jusqu’à fin novembre 2015
  • L’historique des recherches internet autour du fioul sur la même période;

Les autres données utilisables : toute donnée accessible en opendata qui apporterait un gain de modélisation est utilisable à condition que rétrospectivement vous vous assuriez que cette donnée était disponible avant le début de la période à prévoir. Typiquement, si l’on considère les données météo : les données du climat réel jusqu’à fin novembre 2015 peuvent être utilisées, mais au-delà de cette date, seules les prévisions disponibles au 30 novembre 2015 peuvent être intégrées dans le modèle puisque la période à prévoir s’étend du 1er au 15 décembre 2015.

Concernant les données météo, celles-ci peuvent par exemple être récupérées en open data au sein du site MeteoFrance :

Le jeu de données peut être enrichi par d'autres données externes open data que les participants jugeraient utiles.

A vous de modéliser et de nous faire tous gagner.

3 fichiers de données vous sont remis :

  • Le fichier des commandes passées jusqu’au 30 novembre 2015. Il contient 4 170 813 commandes et fournit pour chacune d’elle :
    • La filiale ayant traité la commande (SOC_CODE)
    • La date de la commande (HIV_DATECDE)
    • La commune de livraison (COM_CPOS)
    • Le produit demandé (PRO_LIB1)
    • Le numéro de commande (CDE_CMDE)
    • La catégorie de clientèle du demandeur (CAT_CLI, à trois modalités « PART. », « PRO », « PART. Internet »)
    • Un indice anonymisé du prix de vente unitaire (croissant avec le prix) (IND_PRIX)
    • Le volume livré discrétisé en 4 tranches (QTE) :
      • 1 : 0 à 500 litres,
      • 2 : 501 à 1000 litres,
      • 3 : 1001 à 2000 litres,
      • 4 : Plus de 2000 litres
  • Le fichier des historiques des recherches en lignes de septembre 2013 à novembre 2015 qui fournit pour chaque ensemble de mot clefs distincts (435 ensemble de mots clefs différents) le nombre de demandes constatées chaque mois. Les demandes ont été catégorisées en cluster et sous-catégorie pour en faciliter l’analyse.
  • Le fichier modèle à renvoyer qui doit contenir 7 colonnes :
    • L’identifiant technique de la ligne de réponse (Identifiant)
    • Le libellé du produit demandé (PRO_LIB1)
    • Le département de livraison (DPT), qui correspond aux 2 premiers chiffres du code commune du fichier des commandes,
    • La date de livraison (DATE), du 1er au 15 décembre
    • La filiale (SOC)
    • La tranche de Volume livré (TR, codé de 1 à 4 comme la variable QTE du fichier de commande)
    • Le nombre de commande estimé par votre modèle (Q).

La prévision demandée est donc une prévision quotidienne sur 15 jours à la maille Produit-Département-Filiale-Tranche de volume.

Le fichier à retourner, qui correspond au fichier testSample.csv avec la dernière colonne renseignée doit contenir 102 600 lignes en plus de ligne d’en-tête.

La mesure de performance sera établie sur la base du Root-Mean-Square Deviation (RMSE) qui correspond à l’écart quadratique moyen entre les valeurs prédites et les valeurs observées sur les 102 600 lignes. $$ RMSE = {\sqrt {\frac{1}{n}{\sum\limits_{i = 1}^n {( Q_{i} - \hat{Q_{i}} )^2} }}} $$ Où \(Q_{i}\) est la demande observée et \(\hat{Q_{i}}\) est la demande prédite extraite de votre fichier (n est ici le nombre de prévisions, soit 25 650).

(lire en anglais : http://en.wikipedia.org/wiki/Root-mean-square_deviation)

1. (1) Etienne Fayet 14 contributions 13/12/16 10:50 Score 1,492658
2. (2) SEMMAU Denis 18 contributions 06/11/16 22:58 Score 1,706552
3. (3) Arnaud Chanoine 10 contributions 13/12/16 17:07 Score 1,802148
4. (4) Yassine IDRISSI RHALBI 41 contributions 18/12/16 22:13 Score 1,806068
5. (5) Gilles M 16 contributions 15/01/17 19:19 Score 1,897182
6. (8) Pierre Vaningelandt 3 contributions 16/01/17 01:10 Score 1,998094
7. (6) Aurélien Massiot 8 contributions 03/01/17 14:16 Score 2,047685
8. (17) Remo Tacchi 6 contributions 16/01/17 22:37 Score 2,724781
9. (7) Eric TELLIEZ 8 contributions 06/01/17 14:57 Score 2,755605
10. (9) François Meunier 25 contributions 13/01/17 14:45 Score 3,342756
11. (10) Jean-Marcelin Le M 7 contributions 28/10/16 13:40 Score 3,606950
12. (11) Boualam HASNOUN 5 contributions 07/01/17 00:14 Score 3,801780
13. (12) Fabien Grussy 12 contributions 06/01/17 11:53 Score 4,043171
14. (13) Pierre Jallais 16 contributions 07/11/16 17:49 Score 4,267123
15. (14) Jean-Yves le P 8 contributions 01/11/16 15:01 Score 4,318342
16. (15) Fabrice BERNARD 1 contribution 20/10/16 13:47 Score 4,432806
17. (16) Gael Chevalier 9 contributions 31/10/16 23:19 Score 6,611383
18. (18) Nommie KASHANI 3 contributions 15/01/17 15:32 Score 8,037735
19. (19) David Campion 3 contributions 31/10/16 19:47 Score 9,666767
20. (20) Anne Leroy 1 contribution 09/01/17 14:57 Score 14,894652
Discussions
loading... Chargement...