Retour aux réalisations
ia-automation
•
Publié le 27/05/2026
File Organizer — AI Smart Document Organizer
Organisation intelligente de documents par IA avec OCR et classification automatique
Description du Projet
File Organizer — AI Smart Document Organizer
File Organizer est une application Python utilisant Google Gemini AI pour analyser, renommer et organiser automatiquement des documents de manière intelligente.
Le projet a été conçu pour automatiser la gestion documentaire et réduire le temps passé à classer manuellement des centaines de fichiers.
Objectifs
- Automatiser le classement documentaire
- Générer des noms de fichiers intelligents
- Créer des arborescences propres et cohérentes
- Supporter plusieurs formats de documents
- Ajouter des capacités OCR avancées
Fonctionnalités principales
Renommage intelligent
Analyse du contenu des documents afin de :
- détecter les sujets,
- identifier les dates,
- générer des noms cohérents,
- améliorer l’organisation globale.
Arborescence intelligente
Création automatique de structures de dossiers optimisées :
- limitation des doublons,
- catégories cohérentes,
- fallback automatique,
- réutilisation des structures existantes.
OCR avancé
Support OCR pour :
- PDF scannés,
- images,
- documents sans texte exploitable.
- Tesseract OCR
- Poppler
- pdf2image
Support multilingue
Le système fonctionne :
- en Français,
- en Anglais,
- avec gestion spécifique des contenus multilingues.
Stack Technique
- Python
- Google Gemini API
- Tesseract OCR
- pdf2image
- Poppler
- JSON logging
- CSV/XLSX exports
Défis techniques
Gestion des réponses IA
Le projet inclut :
- validation JSON robuste,
- retry automatique,
- gestion des erreurs API,
- logs détaillés.
Optimisation des coûts API
Mise en place :
- batch processing,
- cache logique,
- limitation des appels IA.
Sécurité & stabilité
Fonctionnalités :
- dry-run sécurisé,
- gestion des fichiers échoués,
- nettoyage automatique,
- logs complets.
Résultats
- Réduction massive du temps de tri manuel
- Classification documentaire automatisée
- Support OCR fiable
- Organisation cohérente des fichiers
- Expérience utilisateur simplifiée
Rôle
Projet développé entièrement par Ayoub ECHEHAB :
- architecture backend,
- logique IA,
- système OCR,
- automatisation,
- UX terminal,
- gestion documentaire.
Liens du Projet
Technologies Utilisées
Python
Gemini AI
OCR
Tesseract
Poppler
pdf2image
Tags associés
#python
#ai
#automation
#ocr
#file-management
#gemini