Bonjour, je suis
Tahar Guenfoud
Data Analyst & Data Scientist
Une décennie d'expertise en enseignement informatique, complétée par un Master en Sciences Informatiques et une formation intensive en Data Science. Je fais le pont entre les données complexes et la prise de décision claire et impactante.
Projets phares
Projets data résolvant des problèmes business concrets
Blackspots — Cartographie des Retards Ferroviaires
Analyse géospatiale de 19,7 millions d'enregistrements Open Data Infrabel (jan 2025 – fév 2026). Heatmap Folium interactive identifiant les points chauds de retards sur 500 gares belges. Analyse de tendance mensuelle avec Plotly, dashboard Streamlit et pipeline Parquet optimisé.
Railway Delay ML — Modélisation Prédictive
Pipeline ML complet sur 19,7M d'enregistrements Open Data Infrabel. Clustering géographique (DBSCAN haversine, 28 bassins), détection d'anomalies (Isolation Forest, 50 gares), décomposition temporelle (STL hebdomadaire), comparaison multi-modèles (XGBoost · GradientBoosting · RandomForest · Stacking). Validation croisée 5 folds avec Pipeline sklearn — sans data leakage. AUC=0.813 · MAE=0.275 min (cross-validé).
Infrabel Dashboard — KPI Qualité Réseau
Dashboard interactif de ponctualité et fiabilité du réseau ferroviaire belge. 5 datasets Open Data Infrabel (ponctualité par gare, causes des retards, trains supprimés, Contrat de Performance). Notebook ETL/EDA complet + Streamlit + Power BI.
SNCB Live Dashboard
Dashboard temps réel de ponctualité ferroviaire belge sur 20 gares majeures. Données live via iRail API (fetch parallèle ThreadPoolExecutor), coordonnées GPS extraites directement de la réponse API. Jauges KPI, carte Folium interactive, heatmap Plotly, distribution des retards, auto-refresh 60s. Notebook Jupyter avec 12 sections d'analyse.
Prédiction de Churn Client Bancaire
Pipeline ML de bout en bout pour prédire l'attrition client dans le secteur bancaire. Identification de 3 facteurs clés impactant 40% des clients à risque via l'analyse comportementale de 10 000+ utilisateurs.
Maven Music — Analyse de Churn
Analyse d'attrition client pour une plateforme de streaming musical. Réduction de l'attrition via l'analyse comportementale de 10 000+ utilisateurs. Dashboard interactif Streamlit déployé en ligne.
Préparation de Données Client Bancaire
Pipeline complet de préparation et nettoyage de données pour les datasets clients bancaires. Processus ETL, évaluation de la qualité des données et préparation de features.
Le Wagon — Analyse de Popularité des Jeux de Société
Projet de fin de formation Le Wagon Data Science & AI (400h+). Modélisation prédictive de la popularité de jeux de société à partir de 20 000+ records BGG enrichis via API REST. Feature engineering, validation croisée et déploiement Streamlit.
Compétences techniques
Langages & Data
Machine Learning
Visualisation & BI
Cloud & Infrastructure
Expérience & Formation
Bootcamp Data Science & IA — 400h+
Le Wagon
Machine Learning, Deep Learning, Data Engineering, MLOps. Projet final en équipe avec déploiement de bout en bout.
Master en Sciences Informatiques
UMONS — Université de Mons
Études avancées en algorithmique, bases de données et génie logiciel.
Professeur d'Informatique
Fédération Wallonie-Bruxelles Enseignement · Mons
Enseignement de Python, SQL et bases de données à 100+ élèves/an. Analyse systématique des données de performance pour adapter les stratégies pédagogiques.
Consultant IT Indépendant
E-zzy · Belgique
Analyse des besoins, architecture réseau et déploiement d'infrastructure IT pour PME. Formation et support technique.
À propos
Quand je ne suis pas plongé dans les données, vous me trouverez en train de m'entraîner pour mon prochain triathlon 🏊🚴🏃. Je crois que la discipline et la pensée analytique requises dans le sport se traduisent directement dans mon approche en data science.
Langues
Contactez-moi
Ouvert aux opportunités data analyst & data scientist en Belgique