Disponible immédiatement

Bonjour, je suis

Tahar Guenfoud

Data Analyst & Data Scientist

Une décennie d'expertise en enseignement informatique, complétée par un Master en Sciences Informatiques et une formation intensive en Data Science. Je fais le pont entre les données complexes et la prise de décision claire et impactante.

Mons, Belgique
Tahar Guenfoud
22M+
Lignes analysées
10
Ans d'expertise technique
400+
Heures de formation Data Science
200+
Élèves formés/an

Projets phares

Projets data résolvant des problèmes business concrets

★ Featured

Blackspots — Cartographie des Retards Ferroviaires

Analyse géospatiale de 19,7 millions d'enregistrements Open Data Infrabel (jan 2025 – fév 2026). Heatmap Folium interactive identifiant les points chauds de retards sur 500 gares belges. Analyse de tendance mensuelle avec Plotly, dashboard Streamlit et pipeline Parquet optimisé.

PythonPandasFoliumPlotlyStreamlitGéospatial
★ Featured

Railway Delay ML — Modélisation Prédictive

Pipeline ML complet sur 19,7M d'enregistrements Open Data Infrabel. Clustering géographique (DBSCAN haversine, 28 bassins), détection d'anomalies (Isolation Forest, 50 gares), décomposition temporelle (STL hebdomadaire), comparaison multi-modèles (XGBoost · GradientBoosting · RandomForest · Stacking). Validation croisée 5 folds avec Pipeline sklearn — sans data leakage. AUC=0.813 · MAE=0.275 min (cross-validé).

PythonXGBoostScikit-learnDBSCANIsolation ForestSTLValidation Croisée
★ Featured

Infrabel Dashboard — KPI Qualité Réseau

Dashboard interactif de ponctualité et fiabilité du réseau ferroviaire belge. 5 datasets Open Data Infrabel (ponctualité par gare, causes des retards, trains supprimés, Contrat de Performance). Notebook ETL/EDA complet + Streamlit + Power BI.

PythonPandasPlotlyStreamlitPower BIOpen Data
★ Featured

SNCB Live Dashboard

Dashboard temps réel de ponctualité ferroviaire belge sur 20 gares majeures. Données live via iRail API (fetch parallèle ThreadPoolExecutor), coordonnées GPS extraites directement de la réponse API. Jauges KPI, carte Folium interactive, heatmap Plotly, distribution des retards, auto-refresh 60s. Notebook Jupyter avec 12 sections d'analyse.

PythonStreamlitPlotlyFoliumiRail APITemps réelPandas
★ Featured

Prédiction de Churn Client Bancaire

Pipeline ML de bout en bout pour prédire l'attrition client dans le secteur bancaire. Identification de 3 facteurs clés impactant 40% des clients à risque via l'analyse comportementale de 10 000+ utilisateurs.

PythonPandasScikit-learnStreamlitFeature Engineering
★ Featured

Maven Music — Analyse de Churn

Analyse d'attrition client pour une plateforme de streaming musical. Réduction de l'attrition via l'analyse comportementale de 10 000+ utilisateurs. Dashboard interactif Streamlit déployé en ligne.

PythonScikit-learnMatplotlibSeabornStreamlit

Préparation de Données Client Bancaire

Pipeline complet de préparation et nettoyage de données pour les datasets clients bancaires. Processus ETL, évaluation de la qualité des données et préparation de features.

PythonPandasNumPyData CleaningETL

Le Wagon — Analyse de Popularité des Jeux de Société

Projet de fin de formation Le Wagon Data Science & AI (400h+). Modélisation prédictive de la popularité de jeux de société à partir de 20 000+ records BGG enrichis via API REST. Feature engineering, validation croisée et déploiement Streamlit.

PythonScikit-learnNumPySeabornAPI RESTStreamlit

Compétences techniques

💻 Langages & Data

PythonSQLPandasNumPyGitDocker

🤖 Machine Learning

Scikit-learnClassificationRegressionClusteringNLPFeature Engineering

📊 Visualisation & BI

Power BITableauStreamlitPlotlySeabornMatplotlib

☁️ Cloud & Infrastructure

AzureETLCI/CDDockerREST APIsMLOps

Expérience & Formation

2025

Bootcamp Data Science & IA — 400h+

Le Wagon

Machine Learning, Deep Learning, Data Engineering, MLOps. Projet final en équipe avec déploiement de bout en bout.

2025

Master en Sciences Informatiques

UMONS — Université de Mons

Études avancées en algorithmique, bases de données et génie logiciel.

2016 — Présent

Professeur d'Informatique

Fédération Wallonie-Bruxelles Enseignement · Mons

Enseignement de Python, SQL et bases de données à 100+ élèves/an. Analyse systématique des données de performance pour adapter les stratégies pédagogiques.

2014 — 2015

Consultant IT Indépendant

E-zzy · Belgique

Analyse des besoins, architecture réseau et déploiement d'infrastructure IT pour PME. Formation et support technique.

À propos

Quand je ne suis pas plongé dans les données, vous me trouverez en train de m'entraîner pour mon prochain triathlon 🏊🚴🏃. Je crois que la discipline et la pensée analytique requises dans le sport se traduisent directement dans mon approche en data science.

Langues

Français — Bilingue Anglais — Courant Arabe — Langue maternelle Russe — Intermédiaire Néerlandais — Notions de base

Contactez-moi

Ouvert aux opportunités data analyst & data scientist en Belgique