TallyDrive – Présentation Technique

🚀 Projet Personnel • Talent Tally

TallyDrive

Mobilité Urbaine Intelligente en Afrique Subsaharienne

⚛️ React Frontend FastAPI · Python Dagster · dbt · Medallion MLflow · Metabase Kubernetes Ready · Bare Metal 🐙 GitHub Actions CI · Tests Unitaires OpenMetadata · Data Governance

Audrey Jordan SOUOP Ingénieur en Science des Données

01 · Contexte & Problématique

Un problème terrain
observé sur 3 pays

🇨🇮🇨🇲🇸🇳

Côte d'Ivoire · Sénégal · Cameroun

Lors de mes passages dans ces 3 pays, j'ai pu identifier deux problèmes structurels récurrents : le transport urbain chaotique et l'exclusion bancaire massive. Ces observations terrain ont directement guidé mes deux projets.

🚌

Transport urbain désorganisé

Absence de traçabilité des véhicules, pas d'estimation de temps d'attente, itinéraires imprévisibles, information passager inexistante. Les usagers naviguent à l'aveugle chaque jour.

📊

Aucune donnée exploitable

Opérateurs de transport sans outils de pilotage. Absence totale de données de mobilité centralisées, rendant impossible toute optimisation ou planification urbaine.

💸

Opportunité de marché

Des centaines de millions d'usagers urbains sans solution numérique fiable. La donnée de mobilité est une ressource sous-exploitée à très forte valeur analytique et prédictive.

3

Pays observés

2

Projets développés

100%

Terrain & data-driven

Live

TestFlight / PlayStore

02 · La Solution

TallyDrive

T

TallyDrive – Application de Mobilité Urbaine

Mise en relation passagers & conducteurs · Géolocalisation temps réel · Analytics embarqués

🍎 App Store 🤖 Play Store

⚛️

Frontend React

Back-office web en React : suivi de flotte en temps réel, gestion des utilisateurs et reporting opérationnel.

📍

Géolocalisation temps réel

OpenStreetMap + Google Maps pour le suivi des véhicules, calcul d'itinéraires et estimation des temps d'arrivée.

⚡

Backend haute performance

FastAPI (Python) pour les APIs REST async, Redis pour le cache et la gestion des sessions temps réel.

🗄️

Persistance robuste

PostgreSQL containerisé sur bare metal pour des performances et une maîtrise totale des données.

🐙

CI · GitHub Actions

Pipeline CI automatisé : tests unitaires, lint et build Docker à chaque push. Zéro code défaillant en prod.

🤖

Intelligence artificielle

Modèles ML gérés via MLflow pour prédiction de demande, anomalies de trafic et optimisation de routes.

📊

Dashboard & Reporting

Metabase self-hosted pour les tableaux de bord opérationnels : KPIs, activité conducteurs, couverture géo.

📋

Gouvernance des données

OpenMetadata pour cataloguer, documenter et gouverner toutes les données de la plateforme.

03 · Architecture Technique

Stack Full Stack · Self-Hosted

📱

Mobile App

iOS · Android

⚛️

React

Back-office

Clients

→

⚡
FastAPI
Python · Async

🔴

Redis

Cache · Sessions

Backend

→

🐘
PostgreSQL
OLTP · Containerisé

🗺️

Geo Services

OSM · Google Maps

Data Layer

→

⚙️
Dagster
Orchestration · CD

🔷

dbt

Modélisation · Medallion

Orchestration

→

📊

Metabase

BI · Dashboards

🤖

MLflow

ML Tracking

Analytics & ML

🐳 Docker (tous services containerisés) 🖥️ Bare Metal Server 🐙 GitHub Actions (CI · Tests unitaires) ⚙️ CD via Dagster 🔷 dbt (Transformation SQL) 📚 OpenMetadata (Catalogue) ⚛️ React (Frontend Web) 🗺️ OpenStreetMap + Google Maps API

04 · CI/CD Pipeline

Intégration & Déploiement
Continus — bout en bout

🐙

Intégration Continue

CI · GitHub Actions

1

Push / Pull Request

Chaque push sur le repository déclenche automatiquement le workflow GitHub Actions.

2

Tests unitaires automatisés

Suite de tests Python sur la logique métier, les endpoints FastAPI et les transformations de données. Aucun code non testé ne passe.

3

Lint & Code Quality

Vérification de la qualité du code avant toute fusion. Aucun code défaillant n'atteint la branche principale.

4

Build & validation Docker

Construction des images Docker et validation des configurations avant déploiement.

⚙️

Déploiement Continu

CD · Dagster

1

Déclenchement Dagster

Après validation CI, Dagster orchestre le déploiement des nouvelles versions des pipelines et services.

2

Exécution des pipelines dbt

Transformation des données, tests de qualité, mise à jour des couches Bronze / Silver / Gold.

3

Mise à jour des conteneurs

Redémarrage des services Docker concernés sur le bare metal avec les nouvelles images validées.

4

Observabilité complète

Dagster log chaque run avec alertes en cas d'échec. Traçabilité totale de chaque déploiement.

05 · Pipeline de Données & Orchestration

De la donnée brute
à l'insight actionnable

1

📡

Ingestion

Données de géolocalisation, courses, événements app mobile en temps réel

FastAPI · PostgreSQL

2

⚙️

Orchestration

Dagster planifie et exécute les pipelines. CD intégrée pour déploiement continu

Dagster

3

🔷

Transformation

Modèles dbt appliquent les règles métiers, tests de qualité, schémas validés

dbt Core

4

🤖

ML & Prédiction

Entraînement, versioning et déploiement des modèles de prédiction de demande

MLflow

5

📊

Exposition

Dashboards Metabase pour les KPIs opérationnels, alertes, reporting

Metabase

🥉

Bronze Layer

Données brutes telles que reçues · Aucune transformation

🥈

Silver Layer

Nettoyées, déduplicquées, enrichies par dbt · Prêtes à l'analyse

🥇

Gold Layer

Agrégats métier · Data marts · Utilisés par Metabase & ML

06 · Outils Data & Gouvernance

Un écosystème data
production-ready

⚙️

Orchestration & CD

Dagster

Gestion des pipelines data avec observabilité native. Implémente la Continuous Delivery : chaque déploiement déclenche automatiquement les pipelines de transformation et de test.

📊

Business Intelligence

Metabase

Self-hosted sur le serveur bare metal. Dashboards opérationnels : activité en temps réel, KPIs conducteurs/passagers, couverture géographique, revenus et alertes métier.

📚

Data Governance & Catalogue

OpenMetadata

Plateforme de gouvernance et catalogage : documentation des datasets, lignage des données, data quality monitoring, ownership et classification des actifs de données.

🤖

ML Lifecycle Management

MLflow

Tracking des expérimentations ML, versioning des modèles, gestion du model registry. Modèles de prédiction de demande, détection d'anomalies de trafic et scoring conducteurs.

07 · Infrastructure & Déploiement

Bare Metal · Tout containerisé

🖥️

Serveur Bare Metal

Tous les services tournent dans des conteneurs Docker isolés

FastAPI

API Backend

Redis

Cache & Sessions

PostgreSQL

Base de données

Dagster

Orchestration + CD

MLflow

ML Tracking

Metabase

Dashboards BI

OpenMetadata

Data Catalogue

React (build)

Front back-office

dbt

Transformation SQL

💰

Maîtrise des coûts Bare metal vs Cloud : coût fixe maîtrisé, pas de surprise de facturation

🔧

Contrôle total Chaque couche est maîtrisée, de l'infra au pipeline de données

📈

Scalabilité prévue Architecture pensée pour migrer vers K8s si croissance

🔄

CI/CD bout en bout GitHub Actions (CI) + Dagster (CD) : zéro déploiement manuel

Ce que TallyDrive
démontre

Un projet full-stack data, de la problématique terrain jusqu'à la production, construit de bout en bout de manière autonome.

⚛️

Full Stack

React + FastAPI

🐙

CI/CD

GitHub Actions + Dagster

🏗️

Architecture Data

Medallion, dbt, orchestration

🔧

Infra & DevOps

Bare metal, Docker

🤖

ML Engineering

MLflow, versioning

📚

Gouvernance

OpenMetadata, catalogue

Prêt à apporter cette rigueur data chez VOUS 🚀