Intelligence artificielle

OCR

Optical Character Recognition

[01]

En clair

Définition vulgarisée

Technologie de reconnaissance optique de caractères : transforme une image (scan, photo, PDF) en texte exploitable. Combiné avec un LLM, devient extrêmement précis pour extraire les données structurées (factures, contrats, formulaires).

[02]

Pour aller plus loin

Détail technique

Acronyme de Optical Character Recognition. Les OCR classiques (Tesseract, ABBYY) reconnaissent les caractères pixel par pixel. Les OCR modernes (Azure Document Intelligence, AWS Textract, Google Document AI, Mistral OCR) combinent vision par ordinateur et LLM pour comprendre la structure du document : tableaux, sections, signatures. Évolution récente : les VLM (Vision-Language Models) comme GPT-4o, Claude 3.5 Sonnet, Gemini font de l'OCR + extraction structurée en un seul appel, avec une précision bluffante sur les documents complexes.

[03]

Exemple concret

Cas business

Une PME suisse reçoit 200 factures fournisseurs/mois en PDF. Un workflow N8N + Claude Vision extrait automatiquement : fournisseur, numéro, date, lignes, TVA, total. Création des écritures Odoo en automatique. Gain : 15h/semaine de saisie comptable.

[04]

Piège à éviter

Erreur fréquente

Les OCR sur factures suisses doivent gérer la QR-bill ISO 20022 : tous ne le font pas nativement. Vérifier la compatibilité avant de standardiser.

Besoin d'un avis concret sur OCR pour votre PME ?

On a déployé OCR en interne avant de le proposer à nos clients. Discutons de votre cas en 30 minutes.