Skip to content

Commit 0b54bc2

Browse files
committed
plan
1 parent abd9ef1 commit 0b54bc2

File tree

2 files changed

+49
-0
lines changed

2 files changed

+49
-0
lines changed

_doc/articles/2025/2025-03-01-route2025.rst

Lines changed: 5 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -160,3 +160,8 @@ Séance 5 (6/3)
160160
* analyses de survie
161161
* DeepAR
162162
* temps réel
163+
164+
Evaluation
165+
==========
166+
167+
* https://defis.data.gouv.fr/

_doc/articles/2025/2025-04-01-route2025.rst

Lines changed: 44 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -118,3 +118,47 @@ Excel avec un graphe automatiquement depuis Python.
118118
* :ref:`l-example-serialization`
119119
* :ref:`l-example-plot-groupby`
120120
* :ref:`Manipulation de données avec pandas <nbl-c_data-nb_pandas>`
121+
122+
Journée 3 (3/3)
123+
===============
124+
125+
**Partie 1**
126+
127+
* retour sur la syntaxe du langage python, boucle, test, fonctions et classes
128+
* exceptions
129+
* expressions régulières
130+
* pickle, fichiers pickle
131+
* tests unitaires
132+
* récupération des fichiers préparés pour la formation avec pandas
133+
* utilisation de skrub pour avoir un premier aperçu
134+
135+
**Partie 2**
136+
137+
* rappel pandas: group by, jointure, inner, outer, left, right, pivot
138+
* gestion des doublons
139+
* une fois la base complète obtenue, analyse de nouveau
140+
* même opérations en SQL
141+
* identification des valeurs aberrantes
142+
* valeurs manquantes, remplacement simple (moyenne), corrélations (KNNImputer)
143+
* premières impressions
144+
145+
Journée 4 (4/3)
146+
===============
147+
148+
**Partie 1**
149+
150+
* retour sur les graphes matplotlib, seaborn, plotly, skrub
151+
* cartographie, cartopy, folium encore
152+
* corrélations, pairplots
153+
* gestion des dates
154+
* cubes de données avec pandas, passer un indice à droite, à gauche
155+
* on reprend chaque colonne
156+
157+
**Partie 2**
158+
159+
* notion d'itérateur en python
160+
* application à pandas read_csv version itérateur pour manipuler des gros dataframes
161+
* utilisation de sqlite3 (extension sqlite3 vscode)
162+
* découpage d'une base en deux, apprentissage, respecter le temps et les identifiants
163+
* calcul du prix d'un contrat d'assurance pour un an en fonction de
164+
variables choisies

0 commit comments

Comments
 (0)