Direct beschikbaar

Hallo, ik ben

Tahar Guenfoud

Data Analyst & Data Scientist

Een decennium expertise in IT-onderwijs, aangevuld met een Master in Informatica en een intensieve Data Science opleiding. Ik overbrug de kloof tussen complexe data en duidelijke, impactvolle besluitvorming.

Bergen, België
Tahar Guenfoud
22M+
Geanalyseerde regels
10
Jaar technische expertise
400+
Uren Data Science training
200+
Studenten opgeleid/jaar

Uitgelichte projecten

Echte dataprojecten die bedrijfsproblemen oplossen

★ Featured

Blackspots — Spoorwegvertraging Cartografie

Geospatiale analyse van 19,7 miljoen Infrabel Open Data records (jan 2025 – feb 2026). Interactieve Folium heatmap die vertragingshotspots in 500 Belgische stations identificeert. Maandelijkse trendanalyse met Plotly, Streamlit dashboard en geoptimaliseerde Parquet pipeline.

PythonPandasFoliumPlotlyStreamlitGeospatial
★ Featured

Railway Delay ML — Voorspellende Modellering

End-to-end ML-pipeline op 19,7M Infrabel Open Data records. Geografische clustering (DBSCAN haversine, 28 bassins), anomaliedetectie (Isolation Forest, 50 stations), temporele decompositie (STL wekelijks), multi-model vergelijking (XGBoost · GradientBoosting · RandomForest · Stacking). 5-voudige kruisvalidatie met sklearn Pipeline — geen data leakage. AUC=0,813 · MAE=0,275 min (kruisgevalideerd).

PythonXGBoostScikit-learnDBSCANIsolation ForestSTLKruisvalidatie
★ Featured

Infrabel Dashboard — KPI Netwerkkwaliteit

Interactief dashboard voor stiptheid en betrouwbaarheid van het Belgische spoornetwerk. 5 Open Data Infrabel datasets (stiptheid per station, vertragingsoorzaken, geschrapted treinen, Prestatiecontract). Volledige ETL/EDA notebook + Streamlit + Power BI.

PythonPandasPlotlyStreamlitPower BIOpen Data
★ Featured

SNCB Live Dashboard

Realtime stiptheidsdashboard voor het Belgische spoorwegnetwerk over 20 grote stations. Live data via iRail API (parallelle fetch via ThreadPoolExecutor), GPS-coördinaten rechtstreeks uit API-respons. KPI-meters, interactieve Folium kaart, Plotly heatmap, vertragingsdistributie, auto-refresh 60s. Jupyter notebook met 12 analysesecties.

PythonStreamlitPlotlyFoliumiRail APIRealtimePandas
★ Featured

Bankklant Churn Voorspelling

End-to-end ML-pipeline om klantenverloop in het bankwezen te voorspellen. 3 sleutelfactoren geïdentificeerd die 40% van de risicokanten beïnvloeden via gedragsanalyse van 10.000+ gebruikers.

PythonPandasScikit-learnStreamlitFeature Engineering
★ Featured

Maven Music — Churn Analyse

Klantenverloop analyse voor een muziek streaming platform. Reductie van klantverloop via gedragsanalyse van 10.000+ gebruikers. Interactief Streamlit dashboard online beschikbaar.

PythonScikit-learnMatplotlibSeabornStreamlit

Bankklant Datacleaning

Uitgebreide data voorbereiding en schoonmaak pipeline voor bankklant datasets. ETL-processen, datakwaliteitsbeoordeling en feature voorbereiding.

PythonPandasNumPyData CleaningETL

Le Wagon — Bordspel Populariteitsanalyse

Eindproject voor Le Wagon Data Science & AI bootcamp (400+ uur). Voorspellende modellering van bordspelpopulariteit uit 20.000+ BGG-records verrijkt via REST API. Feature engineering, kruisvalidatie en Streamlit deployment.

PythonScikit-learnNumPySeabornAPI RESTStreamlit

Technische vaardigheden

💻 Talen & Data

PythonSQLPandasNumPyGitDocker

🤖 Machine Learning

Scikit-learnClassificationRegressionClusteringNLPFeature Engineering

📊 Visualisatie & BI

Power BITableauStreamlitPlotlySeabornMatplotlib

☁️ Cloud & Infrastructuur

AzureETLCI/CDDockerREST APIsMLOps

Ervaring & Opleiding

2025

Data Science & AI Bootcamp — 400+ uur

Le Wagon

Machine Learning, Deep Learning, Data Engineering, MLOps. Eindteamproject met volledige deployment.

2025

Master Informatica

UMONS — Universiteit van Bergen

Geavanceerde studies in algoritmen, databases en software engineering.

2016 — Heden

Informaticaleerkracht

Fédération Wallonie-Bruxelles Onderwijs · Bergen

Lesgeven in Python, SQL en databases aan 100+ studenten/jaar. Systematische analyse van prestatiegegevens om pedagogische strategieën aan te passen.

2014 — 2015

Zelfstandig IT Consultant

E-zzy · België

Behoefteanalyse, netwerkarchitectuur en IT-infrastructuur deployment voor KMO's.

Over mij

Als ik niet met data bezig ben, train ik voor mijn volgende triatlon 🏊🚴🏃. Ik geloof dat de discipline en het analytisch denken die nodig zijn in sport zich direct vertalen naar mijn aanpak in data science.

Talen

Frans — Tweetalig Engels — Vloeiend Arabisch — Moedertaal Russisch — Gemiddeld Nederlands — Basiskennis

Neem contact op

Open voor data analyst & data scientist mogelijkheden in België