Se connecter
Date limite de participation :
16 janvier 2017

Prédiction de la performance d’un puits

L’objectif de ce challenge est de prédire deux indicateurs de performance : les quantités de gaz et de condensat extraits d’un puits, un an après sa mise en service, c’est-à-dire une fois que le système de production est stabilisé.

Classement
1. (1) Arnaud Chanoine Score 2,460501
2. (2) Pierre Cardon Score 2,555987
3. (3) Boualam HASNOUN Score 2,712432
Ce challenge est terminé.

380

contributions

71

participants

terminé
terminé

La prédiction de la production de futurs puits est une problématique importante. Être capable d’anticiper la performance d’un puits va permettre de planifier les investissements à long terme et d’optimiser les stratégies d’acquisition et de vente de terrain.

Usuellement, l’industrie pétrolière s’appuie sur une procédure standard, la Decline Curve Analysis (DCA : http://petrowiki.org/Production_forecasting_decline_curve_analysis). Cette approche générale ne tient pas compte des spécificités de chaque puits.

TOTAL cherche à aller plus loin, en s’appuyant sur des modèles plus précis et proches de la réalité. Pour cela, un programme de récolte de données permettant de caractériser la physique de chaque puits a été mis en place. Sur plusieurs années, des informations de géolocalisation, production, géologie ont été extraites et nettoyées.

L’objectif est désormais d’utiliser au mieux ces données. Plus particulièrement, vous allez être amené à prédire deux indicateurs de performance : les quantités de gaz (GAS360) et de condensat (CUM360) extraits d’un puits, un an après sa mise en service, c’est-à-dire une fois que le système de production est stabilisé.

Pour rajouter une dimension probabiliste au problème, il vous est demandé de ne prédire non pas deux valeurs uniques par puits, mais une surface de confiance (bornes hautes et basses pour le gaz ainsi que le condensat). Cette surface devra être la plus petite possible, tout en contenant les vraies valeurs observées.

2 fichiers vous sont remis :

  • un fichier d’apprentissage contenant les variables cibles observées sur 350 puits.
  • un fichier de test pour lequel vous devez prévoir les intervalles de confiance des variables cibles sur 148 puits.

Le fichier d’apprentissage contient les colonnes suivantes :

ChampDescription
Identifiant
Anonymised identifier
Cum360
Standardized total condensate + gas production first 360 days of production
Avg(360_Days_Gas_Prod) for
Standardized Volume of gas produced during the first 360 days of production
Category
Last 2 characters of Well Name
Anonymised PROD_DT
Anonymised Date of First production
Anonymised COMP_DT
Anonymised Date of Completion
Anonymised SPUD_DT
Anonymised Date of Drilling Start
Anonymised X Coordinate
Anonymised Longitude (Location) of the wellhead
Anonymised Y Coordinate
Anonymised Latitude (Location) of the wellhead
Avg(LATERAL_LENGTH) for
Standardized Length of the horizontal section of the well
Avg(TOTAL_TVD) for
Standardized True Vertical Depth: Depth of the Formation
Avg(TOTAL_MD) for
Standardized Measured Depth: Total Length of the well (vertical + horizontal sections)
production Days
Standardized Number of days the well produced until now
Avg(ISIP_(Instant_Shut-in_Pressure_psi)) for
Standardized Instantaneous Shut-In Pressure, proxy for Stress intensity in the reservoir (http://www.fekete.com/SAN/TheoryAndEquations/WellTestTheoryEquations/ISIP.htm)
Sum(Total_Clean_Volume_Pumped_(bbl)) for
Standardized Toal volume of fluid pumped during completion
Avg(Frac_Gradient_(psi/ft)) for
Standardized Pressure gradient needed to create fractures in the reservoir (http://www.glossary.oilfield.slb.com/en/Terms/f/fracture_gradient.aspx)
Avg(Breakdown_Pressure_(psi)) for
Standardized Pressure needed to create fractures in the reservoir (http://www.glossary.oilfield.slb.com/en/Terms/f/fracture_gradient.aspx)
Avg(Final_(Post_Treatment_Shut-in_Pressure_psi)) for
?
Avg(Pre_Treatment_Shut-in_Pressure_(psi)) for
?
Avg(Min_ reat_Rate_(bpm)) for
Standardized Mininum rate of fluid injection pumped during completion
Avg(Max_Treat_Rate_(bpm)) for
Standardized Maximum rate of fluid injection pumped during completion
Avg(Avg_Treat_Rate_(bpm)) for
Standardized Average of fluid injection pumped during completion
Avg(Min_Treat_Pressure_(psi)) for
Standardized Minimum injection pressure during completion
Avg(Max_Treat_Pressure_(psi)) for
Standardized Max injection pressure during completion
Avg(Avg_Treat_Pressure_(psi)) for
Standardized Average injection pressure during completion
Sum(Proppant_In Formation (lb)) for
Standardized Weight of proppant pumped during completion
Avg(Entered_ Shot_ Total) for
Standardized Total number of shots in the well
Avg(Shot_ Density_ shots/ft) for
Standardized Total number of perforations in the well / ft
Avg(Stage_ Length_(Calculated Field)) for
Standardized Length of each stage
Avg(Total_ No_ of Perfs) for
Standardized Total number of perforations in the well
Avg(NO_ of_ STAGES) for
Standardized Number of stages in the well
Avg(Vp_PT_PLEASANT) for
Standardized Sonic velocity (compression waves) measured from logs; used as a proxy for pressure
Avg(VTOC_UTICA) for
Standardized volume of organic matter in the Utica formation
Avg(GIPTOT_(bcf/section)_UTICA) for
Standardized Gas in Place Utica
Avg(SW) for
Standardized Saturation in Water Pt Pleasant
Avg(PAYFLAG_(NTG)) for
Standardized Net-to-Gross (ratio reservoir non reservoir facies in the formation) Pt Pleasant
Avg(YOUNG'S_MODULUS_PT_PLEASANT) for
Standardized Geomechanical property (Young Modulus) Pt Pleasant
Avg(POISSON_RATIO_PT_PLEASANT) for
Standardized Geomechanical property (Poisson Ratio)
Avg(FRACTURE_TOUGHNESS) for
Standardized Geomechanical property (Fracture toughness)
Avg(GIPTOT_(bcf/section)_PT_PLEASANT) for
Standardized Gas in Place Pt Pleasant
Avg(NPHI_PT_PLEASANT) for
Standardized Porosity measured from neutron logs Pt-Pleasant
Avg(THICKNESS_PT_PLEASANT) for
Standardized Thickness Pt-Pleasant
Avg(MATURITY_PT_ PLEASANT) for
Standardized Source rock maturity (Higher --> more gas, Lower --> more condensate)
Avg(UPLIFT_MAGNITUDE_ PT_PLEASANT) for
Standardized Uplift intensity that occurred in the basin
Avg(MAX_DEPTH_BURIAL_PT_PLEASANT) for
Standardized Maximum depth of burial of the Pt-Pleasant before uplift
Avg(TEMP_ANAMOLY_PT_PLEASANT) for
Standardized Temperature anomaly compared to average geotherm in the Appalachian
Avg(TEMP_PT_PLEASANT) for
Standardized Temperature of the Pt Pleasant formation
Avg(VS_PT_PLEASANT) for
Standardized Sonic velocity (shears waves) measured from logs Pt Pleasant
Avg(MHS_PT_PLEASANT_(Min_Horz_Stress)) for
Standardized Minimum horizontal stress calculated from logs Pt Pleasant
Avg(RESISTIVITY_PT_PLEASANT) for
Standardized Resistivity of the Pt-Pleasant formation
Avg(GR_PT_PLEASANT) for
Standardized Gamma Ray Pt-Pleasant formation
Avg(VCLAY_UTICA) for
Standardized volume of clay in the Utica Formation
Avg(VTOC_PT_PLEASANT) for
Standardized volume of organic matter in the Pt-Pleasant formation
Avg(VCARB_PT_PLEASANT) for
Standardized volume of carbonates matter in the Pt-Pleasant formation
Avg(VCLAY_PT_PLEASANT) for
Standardized volume of clay in the Pt-Pleasant formation
Avg(POROSITY FROM DENSITY LOGS) for
Standardized Porosity in the Pt Pleasant measured from density logs
Surf X SP OH-N 27
Standardized surface location of the well head SPOH N27 coordinates
Surf Y SP OH-N 27
Standardized surface location of the well head SPOH N27 coordinates
Proppant per foot
Standardized Weight of proppant pumped during completion normalied per feet
Clusters
Standardized cluster
Cluster spacing
Sgtandardized Cluster Spacing

Le fichier de test contient les mêmes colonnes à l’exclusion des variables CUM360 et GAS360.

Le fichier à poster est un fichier de type CSV à séparateur « ; » qui doit contenir 5 colonnes et 148 lignes, outre l’en-tête, chaque ligne corresponde à un des individus de l’échantillon de test. Les 5 colonnes sont dans l’ordre  :

  • ID : l’identifiant du puit prédit
  • CUM360_INF : Borne inférieure de l’intervalle de confiance proposé pour la valeur de la variable CUM360
  • CUM360_SUP : Borne supérieure de l’intervalle de confiance proposé pour la valeur de la variable CUM360
  • GAS360_INF : Borne inférieure de l’intervalle de confiance proposé pour la valeur de la variable GAS360
  • GAS360_SUP : Borne supérieure de l’intervalle de confiance proposé pour la valeur de la variable GAS360

Pour être valide, votre fichier doit

  • respecter le format précédent,
  • ne contenir aucun doublon sur l’ID,
  • vérifier les inégalités suivantes :
    \(CUM360_{inf} \leq CUM360_{sup}\)
    \(GAS360_{inf} \leq GAS360_{sup}\)

La métrique d’évaluation de votre fichier est la suivante :$$M = \frac{1}{k} \sum_{i=1}^k \left((S_{i} * \Bbb{1}_i) + 10 * (1 - \Bbb{1}_i)\right)$$où$$ S_i = (CUM360_{sup} - CUM360_{inf}) * (GAS360_{sup} - GAS360_{inf}) $$$$ \Bbb{1}_i = \Bbb{1}_{\begin{Bmatrix}CUM360_{inf} \leq CUM360 \leq CUM360_{sup} \\GAS360_{inf} \leq GAS360 \leq GAS360_{sup}\end{Bmatrix}} $$Et k représente la taille de l’échantillon sur lequel sera calculé la métrique.

Afin d’éviter le surapprentissage par soumissions successives, l’échantillon test sera découpé en 2 sous-échantillons de 74 puits :

  • un sous-échantillon public sur lequel se fera l’évaluation de vos contributions,
  • un sous-échantillon privé servant au classement final.

La métrique ainsi définie doit être minimisée. Elle représente la moyenne pondérée des surfaces des boites de confiances proposées pour lesquelles le point est dans la boite avec une pénalisation à une surface de 10 lorsque le point n’est pas dans la boite comme illustré ci-dessous :

Dans le graphique illustratif ci-contre, la prévision proposée pour le point vert est une boite contenant le point réel. Sa surface (d’approximativement 1) sera donc prise en compte dans la formule de la métrique.

A l’inverse, la prévision proposée pour le point rouge ne contient pas le point réel : on remplace donc sa surface (d’approximativement ½ ici) par 10 pour pénaliser le fait que le point n’est pas inclut dans l’intervalle de confiance.

Le choix de cette valeur de pénalisation est liée au fait qu’une boite carrée de surface 10 contient près de 90% des points de l’apprentissage : il est donc a priori aisé de faire beaucoup mieux que 10 en termes de surface et l’on souhaite que les boites de confiance fournies contiennent les prévisions dans la majorité des cas.

1. (1) Arnaud Chanoine 26 contributions 09/12/16 15:41 Score 2,460501
2. (2) Pierre Cardon 77 contributions 07/12/16 08:37 Score 2,555987
3. (3) Boualam HASNOUN 3 contributions 09/12/16 21:15 Score 2,712432
4. (4) Etienne Fayet 49 contributions 09/12/16 13:51 Score 2,876973
5. (5) François Meunier 5 contributions 13/01/17 17:17 Score 3,149865
6. (6) Remo Tacchi 6 contributions 02/01/17 15:04 Score 3,155135
7. (7) Yassine IDRISSI RHALBI 21 contributions 31/12/16 23:49 Score 3,187143
8. (8) sebastien perrier 4 contributions 16/01/17 18:17 Score 3,299006
9. (9) Aurélien Massiot 13 contributions 16/12/16 11:25 Score 3,461943
10. (10) Christiane KAMDEM 4 contributions 18/11/16 10:45 Score 3,584416
11. (11) Daniel Arogundade 27 contributions 15/01/17 22:45 Score 3,837629
12. (12) Pierre Vaningelandt 5 contributions 10/01/17 19:44 Score 3,932162
13. (13) Guillaume Pottier 24 contributions 13/01/17 13:20 Score 4,024324
14. (14) Scion ingred 18 contributions 15/01/17 08:49 Score 4,215631
15. (15) David Campion 3 contributions 16/11/16 13:28 Score 4,405185
16. Sophanara DE LOPEZ 5 contributions 16/01/17 22:49 Score 4,550346
17. (16) David TEIXUGUEIRA DE CASTRO 4 contributions 05/12/16 17:07 Score 5,003710
18. (17) Pierre Jallais 3 contributions 02/01/17 16:25 Score 5,050284
19. (18) Jean-Gudule Le N 17 contributions 14/11/16 22:19 Score 5,224678
20. (19) Jean-Marcelin Le M 6 contributions 05/11/16 16:43 Score 5,511544
21. (20) DUZAN Thomas 2 contributions 26/10/16 14:53 Score 7,117568
22. (21) SEMMAU Denis 3 contributions 13/12/16 23:57 Score 8,935407
Discussions
loading... Chargement...