🚀 Projet Personnel • Talent Tally
TallyDrive
Mobilité Urbaine Intelligente en Afrique Subsaharienne
⚛️ React Frontend FastAPI · Python Dagster · dbt · Medallion MLflow · Metabase Kubernetes Ready · Bare Metal 🐙 GitHub Actions CI · Tests Unitaires OpenMetadata · Data Governance
Audrey Jordan SOUOP Ingénieur en Science des Données
01 · Contexte & Problématique
Un problème terrain
observé sur 3 pays
🇨🇮🇨🇲🇸🇳

Côte d'Ivoire · Sénégal · Cameroun

Lors de mes passages dans ces 3 pays, j'ai pu identifier deux problèmes structurels récurrents : le transport urbain chaotique et l'exclusion bancaire massive. Ces observations terrain ont directement guidé mes deux projets.

🚌

Transport urbain désorganisé

Absence de traçabilité des véhicules, pas d'estimation de temps d'attente, itinéraires imprévisibles, information passager inexistante. Les usagers naviguent à l'aveugle chaque jour.

📊

Aucune donnée exploitable

Opérateurs de transport sans outils de pilotage. Absence totale de données de mobilité centralisées, rendant impossible toute optimisation ou planification urbaine.

💸

Opportunité de marché

Des centaines de millions d'usagers urbains sans solution numérique fiable. La donnée de mobilité est une ressource sous-exploitée à très forte valeur analytique et prédictive.

3
Pays observés
2
Projets développés
100%
Terrain & data-driven
Live
TestFlight / PlayStore
02 · La Solution
TallyDrive

TallyDrive – Application de Mobilité Urbaine

Mise en relation passagers & conducteurs · Géolocalisation temps réel · Analytics embarqués

🍎 App Store 🤖 Play Store
⚛️

Frontend React

Back-office web en React : suivi de flotte en temps réel, gestion des utilisateurs et reporting opérationnel.

📍

Géolocalisation temps réel

OpenStreetMap + Google Maps pour le suivi des véhicules, calcul d'itinéraires et estimation des temps d'arrivée.

Backend haute performance

FastAPI (Python) pour les APIs REST async, Redis pour le cache et la gestion des sessions temps réel.

🗄️

Persistance robuste

PostgreSQL containerisé sur bare metal pour des performances et une maîtrise totale des données.

🐙

CI · GitHub Actions

Pipeline CI automatisé : tests unitaires, lint et build Docker à chaque push. Zéro code défaillant en prod.

🤖

Intelligence artificielle

Modèles ML gérés via MLflow pour prédiction de demande, anomalies de trafic et optimisation de routes.

📊

Dashboard & Reporting

Metabase self-hosted pour les tableaux de bord opérationnels : KPIs, activité conducteurs, couverture géo.

📋

Gouvernance des données

OpenMetadata pour cataloguer, documenter et gouverner toutes les données de la plateforme.

03 · Architecture Technique
Stack Full Stack · Self-Hosted
📱
Mobile App
iOS · Android
⚛️
React
Back-office
Clients
FastAPI
Python · Async
🔴
Redis
Cache · Sessions
Backend
🐘
PostgreSQL
OLTP · Containerisé
🗺️
Geo Services
OSM · Google Maps
Data Layer
⚙️
Dagster
Orchestration · CD
🔷
dbt
Modélisation · Medallion
Orchestration
📊
Metabase
BI · Dashboards
🤖
MLflow
ML Tracking
Analytics & ML
🐳 Docker (tous services containerisés) 🖥️ Bare Metal Server 🐙 GitHub Actions (CI · Tests unitaires) ⚙️ CD via Dagster 🔷 dbt (Transformation SQL) 📚 OpenMetadata (Catalogue) ⚛️ React (Frontend Web) 🗺️ OpenStreetMap + Google Maps API
04 · CI/CD Pipeline
Intégration & Déploiement
Continus — bout en bout
🐙

Intégration Continue

CI · GitHub Actions
1

Push / Pull Request

Chaque push sur le repository déclenche automatiquement le workflow GitHub Actions.

2

Tests unitaires automatisés

Suite de tests Python sur la logique métier, les endpoints FastAPI et les transformations de données. Aucun code non testé ne passe.

3

Lint & Code Quality

Vérification de la qualité du code avant toute fusion. Aucun code défaillant n'atteint la branche principale.

4

Build & validation Docker

Construction des images Docker et validation des configurations avant déploiement.

⚙️

Déploiement Continu

CD · Dagster
1

Déclenchement Dagster

Après validation CI, Dagster orchestre le déploiement des nouvelles versions des pipelines et services.

2

Exécution des pipelines dbt

Transformation des données, tests de qualité, mise à jour des couches Bronze / Silver / Gold.

3

Mise à jour des conteneurs

Redémarrage des services Docker concernés sur le bare metal avec les nouvelles images validées.

4

Observabilité complète

Dagster log chaque run avec alertes en cas d'échec. Traçabilité totale de chaque déploiement.

05 · Pipeline de Données & Orchestration
De la donnée brute
à l'insight actionnable
1
📡
Ingestion
Données de géolocalisation, courses, événements app mobile en temps réel
FastAPI · PostgreSQL
2
⚙️
Orchestration
Dagster planifie et exécute les pipelines. CD intégrée pour déploiement continu
Dagster
3
🔷
Transformation
Modèles dbt appliquent les règles métiers, tests de qualité, schémas validés
dbt Core
4
🤖
ML & Prédiction
Entraînement, versioning et déploiement des modèles de prédiction de demande
MLflow
5
📊
Exposition
Dashboards Metabase pour les KPIs opérationnels, alertes, reporting
Metabase
🥉

Bronze Layer

Données brutes telles que reçues · Aucune transformation

🥈

Silver Layer

Nettoyées, déduplicquées, enrichies par dbt · Prêtes à l'analyse

🥇

Gold Layer

Agrégats métier · Data marts · Utilisés par Metabase & ML

06 · Outils Data & Gouvernance
Un écosystème data
production-ready
⚙️
Orchestration & CD

Dagster

Gestion des pipelines data avec observabilité native. Implémente la Continuous Delivery : chaque déploiement déclenche automatiquement les pipelines de transformation et de test.

📊
Business Intelligence

Metabase

Self-hosted sur le serveur bare metal. Dashboards opérationnels : activité en temps réel, KPIs conducteurs/passagers, couverture géographique, revenus et alertes métier.

📚
Data Governance & Catalogue

OpenMetadata

Plateforme de gouvernance et catalogage : documentation des datasets, lignage des données, data quality monitoring, ownership et classification des actifs de données.

🤖
ML Lifecycle Management

MLflow

Tracking des expérimentations ML, versioning des modèles, gestion du model registry. Modèles de prédiction de demande, détection d'anomalies de trafic et scoring conducteurs.

07 · Infrastructure & Déploiement
Bare Metal · Tout containerisé
🖥️

Serveur Bare Metal

Tous les services tournent dans des conteneurs Docker isolés

FastAPI
API Backend
Redis
Cache & Sessions
PostgreSQL
Base de données
Dagster
Orchestration + CD
MLflow
ML Tracking
Metabase
Dashboards BI
OpenMetadata
Data Catalogue
React (build)
Front back-office
dbt
Transformation SQL
💰
Maîtrise des coûts Bare metal vs Cloud : coût fixe maîtrisé, pas de surprise de facturation
🔧
Contrôle total Chaque couche est maîtrisée, de l'infra au pipeline de données
📈
Scalabilité prévue Architecture pensée pour migrer vers K8s si croissance
🔄
CI/CD bout en bout GitHub Actions (CI) + Dagster (CD) : zéro déploiement manuel
Ce que TallyDrive
démontre
Un projet full-stack data, de la problématique terrain jusqu'à la production, construit de bout en bout de manière autonome.
⚛️

Full Stack

React + FastAPI

🐙

CI/CD

GitHub Actions + Dagster

🏗️

Architecture Data

Medallion, dbt, orchestration

🔧

Infra & DevOps

Bare metal, Docker

🤖

ML Engineering

MLflow, versioning

📚

Gouvernance

OpenMetadata, catalogue