M2 Mathématiques & Applications (M2A) — Sorbonne Université. Je transforme des données complexes en décisions business : modélisation fiable (pipelines scikit-learn, CV temporelle), mise en prod légère (FastAPI, Docker) et communication claire (dashboards Power BI/Tableau). Disponible immédiatement en Île-de-France.
Actuellement
- Portefeuille de projets concrets : énergie (prévision conso/production), mobilité urbaine, assistants RAG.
- PoC d’early stopping (RKHS/boosting) reproductible.
Je recherche un poste de Data Scientist Junior pour mettre en production des modèles utiles et mesurables.
Python (pandas, NumPy, polars, matplotlib) · SQL (CTE, fenêtres) · scikit-learn (Pipeline/ColumnTransformer, GridSearchCV) · XGBoost/LightGBM · time series · Power BI / Tableau · FastAPI · Docker · Git/GitHub · tests/packaging · LangChain/LangGraph (RAG)
- eco2mix-forecast — Prévision conso/production électrique (RTE éCO₂mix). API FastAPI
/predict
, modèlejoblib
, Dockerfile, dashboard BI. → repo (à publier) - velib-availability-analytics — Agrégations spatio-temporelles, heatmaps horaires, stations critiques, rapport d’insights. → repo (à publier)
- kaggle-titanic-baseline — Pipeline « entretien » (GridSearchCV, courbes d’apprentissage, ROC-AUC). → repo
- rag-eco2mix-faq — Assistant RAG (retriever, éval faithfulness), LangGraph minimal, démo CLI. → repo (à publier)
- rkhs-boosting-early-stopping — Expérimentations + notes (règle de discrépance). → repo (à publier)
- data-challenge-elmy — Différentiel de prix Intraday–Spot (features énergie, protocole d’évaluation). → repo (à publier)
📌 Épingle ces 6 dépôts + ajoute une bannière (cover) & topics cohérents.