Intelligence artificielle

Whisper

[01]

En clair

Définition vulgarisée

Modèle open source d'OpenAI pour la transcription automatique de l'audio vers le texte. Supporte 99 langues, gère le bruit ambiant et les accents. Disponible en API payante ou en self-hosted gratuit.

[02]

Pour aller plus loin

Détail technique

Sorti en 2022 par OpenAI sous licence MIT, Whisper est un modèle de speech-to-text basé sur l'architecture Transformer. Taille des modèles : tiny (39M params, rapide), base, small, medium, large (1.5B params, plus précis). Whisper Turbo (2025) accélère l'inférence x8. Supporte le français parfaitement, gère plusieurs locuteurs, ajoute la ponctuation automatiquement. Usage : transcription de réunions, sous-titrage automatique, voice memos transformés en notes, intégration dans des call centers.

[03]

Exemple concret

Cas business

Devodia transcrit tous ses appels commerciaux clients via Whisper self-hosted (whisper.devodia.ch). Les transcriptions sont automatiquement résumées par Claude et synchronisées dans Odoo CRM comme notes d'opportunité. Plus jamais d'oubli de point évoqué.

[04]

Piège à éviter

Erreur fréquente

Whisper hallucine parfois sur les silences longs ou les bruits ambiants : il invente des phrases plausibles. Validation humaine recommandée pour les contenus critiques.

Besoin d'un avis concret sur Whisper pour votre PME ?

On a déployé Whisper en interne avant de le proposer à nos clients. Discutons de votre cas en 30 minutes.