Hallo, ik ben
Tahar Guenfoud
Data Analyst & Data Scientist
Een decennium expertise in IT-onderwijs, aangevuld met een Master in Informatica en een intensieve Data Science opleiding. Ik overbrug de kloof tussen complexe data en duidelijke, impactvolle besluitvorming.
Uitgelichte projecten
Echte dataprojecten die bedrijfsproblemen oplossen
Blackspots — Spoorwegvertraging Cartografie
Geospatiale analyse van 19,7 miljoen Infrabel Open Data records (jan 2025 – feb 2026). Interactieve Folium heatmap die vertragingshotspots in 500 Belgische stations identificeert. Maandelijkse trendanalyse met Plotly, Streamlit dashboard en geoptimaliseerde Parquet pipeline.
Railway Delay ML — Voorspellende Modellering
End-to-end ML-pipeline op 19,7M Infrabel Open Data records. Geografische clustering (DBSCAN haversine, 28 bassins), anomaliedetectie (Isolation Forest, 50 stations), temporele decompositie (STL wekelijks), multi-model vergelijking (XGBoost · GradientBoosting · RandomForest · Stacking). 5-voudige kruisvalidatie met sklearn Pipeline — geen data leakage. AUC=0,813 · MAE=0,275 min (kruisgevalideerd).
Infrabel Dashboard — KPI Netwerkkwaliteit
Interactief dashboard voor stiptheid en betrouwbaarheid van het Belgische spoornetwerk. 5 Open Data Infrabel datasets (stiptheid per station, vertragingsoorzaken, geschrapted treinen, Prestatiecontract). Volledige ETL/EDA notebook + Streamlit + Power BI.
SNCB Live Dashboard
Realtime stiptheidsdashboard voor het Belgische spoorwegnetwerk over 20 grote stations. Live data via iRail API (parallelle fetch via ThreadPoolExecutor), GPS-coördinaten rechtstreeks uit API-respons. KPI-meters, interactieve Folium kaart, Plotly heatmap, vertragingsdistributie, auto-refresh 60s. Jupyter notebook met 12 analysesecties.
Bankklant Churn Voorspelling
End-to-end ML-pipeline om klantenverloop in het bankwezen te voorspellen. 3 sleutelfactoren geïdentificeerd die 40% van de risicokanten beïnvloeden via gedragsanalyse van 10.000+ gebruikers.
Bankklant Datacleaning
Uitgebreide data voorbereiding en schoonmaak pipeline voor bankklant datasets. ETL-processen, datakwaliteitsbeoordeling en feature voorbereiding.
Le Wagon — Bordspel Populariteitsanalyse
Eindproject voor Le Wagon Data Science & AI bootcamp (400+ uur). Voorspellende modellering van bordspelpopulariteit uit 20.000+ BGG-records verrijkt via REST API. Feature engineering, kruisvalidatie en Streamlit deployment.
Technische vaardigheden
Talen & Data
Machine Learning
Visualisatie & BI
Cloud & Infrastructuur
Ervaring & Opleiding
Data Science & AI Bootcamp — 400+ uur
Le Wagon
Machine Learning, Deep Learning, Data Engineering, MLOps. Eindteamproject met volledige deployment.
Master Informatica
UMONS — Universiteit van Bergen
Geavanceerde studies in algoritmen, databases en software engineering.
Informaticaleerkracht
Fédération Wallonie-Bruxelles Onderwijs · Bergen
Lesgeven in Python, SQL en databases aan 100+ studenten/jaar. Systematische analyse van prestatiegegevens om pedagogische strategieën aan te passen.
Zelfstandig IT Consultant
E-zzy · België
Behoefteanalyse, netwerkarchitectuur en IT-infrastructuur deployment voor KMO's.
Over mij
Als ik niet met data bezig ben, train ik voor mijn volgende triatlon 🏊🚴🏃. Ik geloof dat de discipline en het analytisch denken die nodig zijn in sport zich direct vertalen naar mijn aanpak in data science.
Talen
Neem contact op
Open voor data analyst & data scientist mogelijkheden in België