En clair
Définition vulgarisée
Technologie de reconnaissance optique de caractères : transforme une image (scan, photo, PDF) en texte exploitable. Combiné avec un LLM, devient extrêmement précis pour extraire les données structurées (factures, contrats, formulaires).
Pour aller plus loin
Détail technique
Acronyme de Optical Character Recognition. Les OCR classiques (Tesseract, ABBYY) reconnaissent les caractères pixel par pixel. Les OCR modernes (Azure Document Intelligence, AWS Textract, Google Document AI, Mistral OCR) combinent vision par ordinateur et LLM pour comprendre la structure du document : tableaux, sections, signatures. Évolution récente : les VLM (Vision-Language Models) comme GPT-4o, Claude 3.5 Sonnet, Gemini font de l'OCR + extraction structurée en un seul appel, avec une précision bluffante sur les documents complexes.
Exemple concret
Cas business
Une PME suisse reçoit 200 factures fournisseurs/mois en PDF. Un workflow N8N + Claude Vision extrait automatiquement : fournisseur, numéro, date, lignes, TVA, total. Création des écritures Odoo en automatique. Gain : 15h/semaine de saisie comptable.
Piège à éviter
Erreur fréquente
Les OCR sur factures suisses doivent gérer la QR-bill ISO 20022 : tous ne le font pas nativement. Vérifier la compatibilité avant de standardiser.
Besoin d'un avis concret sur OCR pour votre PME ?
On a déployé OCR en interne avant de le proposer à nos clients. Discutons de votre cas en 30 minutes.