Bonjour, je suis Fabien Cappelli.

Cyberpunk à chien. Ancien paléographe. Docteur en linguistique. Formé aux mathématiques, à la data science et à l’AI engineering.

Je travaille aujourd’hui à l’intersection de l’implémentation technique, de la documentation, de l’IA appliquée et des systèmes concrets.

En ce moment

  • construction de Robie, un assistant vocal local sur Raspberry Pi
  • conception de documentation technique, workflows et systèmes d’information
  • apprentissage de l’IA agentique pour la supply chain : document intelligence, traçabilité et automatisation de décisions

Projets mis en avant

Repenser un écosystème documentaire

Refonte d’un système documentaire, CI/CD de contenu, intégration knowledge base et exploitation par des outils IA conversationnels et assistants développeur.

MkDocs Markdown Git CI/CD API Mermaid

Robie

Assistant vocal sur Raspberry Pi

Python Vosk TTS

Release Video Generator

Pipeline Python qui transforme un export Jira HTML en vidéo de release narrée, avec génération de script thématique, synthèse vocale et rendu vidéo automatisé.

Python OpenAI API BeautifulSoup FFmpeg Pydub

Segmentation Sémantique d’Images (Projets Open Classroom 8 & 9)

Segmentation sémantique d’images appliquée à des systèmes de vision intelligents, en utilisant des scènes urbaines issues du dataset Cityscapes.

Python Keras Segmentation Models FastAPI Streamlit Docker

Prédiction de sentiment d'un tweet (Projet Open Classroom 7)

Analyse de sentiment sur 1,6M tweets avec comparaison de modèles NLP (TF-IDF, CNN, LSTM, DistilBERT), suivi MLOps complet, API cloud et déploiement CI/CD.

Python Pandas Scikit-learn Keras Hugging Face Transformers DistilBERT

Projet Big Data Cloud — Pipeline PySpark sur AWS pour la reconnaissance d’images (Fruits-360) (Projet Open Classroom 11)

Conception et déploiement d’un pipeline Big Data scalable pour le traitement massif d’images, l’extraction automatique de caractéristiques visuelles et la réduction de dimension, dans une logique de workflow data engineering et machine learning orienté production.

Python AWS S3 EMR Spark PySpark JupyterHub

Derniers articles