Retour aux réalisations
ia-automation Publié le 27/05/2026

File Organizer — AI Smart Document Organizer

Organisation intelligente de documents par IA avec OCR et classification automatique

File Organizer — AI Smart Document Organizer

Description du Projet

File Organizer — AI Smart Document Organizer

File Organizer est une application Python utilisant Google Gemini AI pour analyser, renommer et organiser automatiquement des documents de manière intelligente.

Le projet a été conçu pour automatiser la gestion documentaire et réduire le temps passé à classer manuellement des centaines de fichiers.

Objectifs

  • Automatiser le classement documentaire
  • Générer des noms de fichiers intelligents
  • Créer des arborescences propres et cohérentes
  • Supporter plusieurs formats de documents
  • Ajouter des capacités OCR avancées

Fonctionnalités principales

Renommage intelligent

Analyse du contenu des documents afin de :

  • détecter les sujets,
  • identifier les dates,
  • générer des noms cohérents,
  • améliorer l’organisation globale.

Arborescence intelligente

Création automatique de structures de dossiers optimisées :

  • limitation des doublons,
  • catégories cohérentes,
  • fallback automatique,
  • réutilisation des structures existantes.

OCR avancé

Support OCR pour :

  • PDF scannés,
  • images,
  • documents sans texte exploitable.
Technologies utilisées :
  • Tesseract OCR
  • Poppler
  • pdf2image

Support multilingue

Le système fonctionne :

  • en Français,
  • en Anglais,
  • avec gestion spécifique des contenus multilingues.

Stack Technique

  • Python
  • Google Gemini API
  • Tesseract OCR
  • pdf2image
  • Poppler
  • JSON logging
  • CSV/XLSX exports

Défis techniques

Gestion des réponses IA

Le projet inclut :

  • validation JSON robuste,
  • retry automatique,
  • gestion des erreurs API,
  • logs détaillés.

Optimisation des coûts API

Mise en place :

  • batch processing,
  • cache logique,
  • limitation des appels IA.

Sécurité & stabilité

Fonctionnalités :

  • dry-run sécurisé,
  • gestion des fichiers échoués,
  • nettoyage automatique,
  • logs complets.

Résultats

  • Réduction massive du temps de tri manuel
  • Classification documentaire automatisée
  • Support OCR fiable
  • Organisation cohérente des fichiers
  • Expérience utilisateur simplifiée

Rôle

Projet développé entièrement par Ayoub ECHEHAB :

  • architecture backend,
  • logique IA,
  • système OCR,
  • automatisation,
  • UX terminal,
  • gestion documentaire.

Technologies Utilisées

Python Gemini AI OCR Tesseract Poppler pdf2image

Tags associés

#python #ai #automation #ocr #file-management #gemini

Galerie du projet