Transcrivez et identifiez chaque locuteur automatiquement.

Vook attribue chaque prise de parole au bon intervenant avec une précision jusqu'à 99 %, horodatage inclus. Vos fichiers sont hébergés en France.

Identifier les locuteurs Voir les tarifs

Identification des locuteurs

Déposez votre fichier audio ou vidéo ici

ou cliquez pour parcourir

Parcourir les fichiers →

MP3WAVMP4M4AMOVOGG

+14 de plus

Choisi par plus de 75 000 utilisateurs

99% de précision

1 transcription gratuite par jour

Avec ou sans abonnement

Précision en conditions optimales: 99 %
Par heure d'audio: < 1 min
Langues prises en charge: 100+
Professionnels: 75k+

Comment ça marche

Trois étapes pour une transcription avec locuteurs identifiés

Aucun logiciel à installer, aucun formulaire à remplir. Déposez votre fichier, on s'occupe du reste.

Déposez votre fichier

Glissez-déposez votre fichier ou choisissez-le depuis votre ordinateur. Fichiers jusqu'à 6 Go acceptés, sans installation.

Vook.ai transcrit en quelques minutes

Vook.ai détecte les locuteurs, ajoute les horodatages, et produit une transcription propre et ponctuée. Généralement moins d'une minute par heure d'audio.

Modifiez, exportez, interrogez

Relisez dans notre éditeur, exportez en PDF, DOCX, MD, SRT ou HTML, et demandez au chat de résumer, extraire des citations ou identifier les thèmes.

Pourquoi Vook.ai

L'IA de transcription qui ne lit pas vos données.

La souveraineté européenne n'est pas une option, c'est notre fondation. Vos fichiers restent les vôtres : chiffrés, hébergés en UE, jamais utilisés pour l'entraînement.

Hébergé en UE

Vos fichiers restent sur une infrastructure française et ne traversent jamais l'Atlantique. Conforme RGPD, aucune exposition au Cloud Act.

Chiffrement AES-256

Chiffrement AES-256 au repos. Vous seul accédez à vos transcriptions.

Jamais utilisé pour l'entraînement

Vos audios et transcriptions ne sont jamais utilisés pour l'entraînement, jamais revendus, jamais analysés pour la publicité.

Conforme RGPD

Conçu dès le premier jour pour la conformité européenne. DPA sur demande, audit complet, droit à l'effacement respecté.

Formats

Tous vos fichiers audio et vidéo acceptés

Vook.ai lit tous les formats audio et vidéo courants, et exporte vers ce dont votre flux a besoin.

Nous avons conçu la diarisation de Vook pour que chaque voix soit traçable, chaque segment vérifiable, et chaque fichier effacé dès que vous n'en avez plus besoin.

Équipe ingénierie Vook.ai

Formats d'entrée

.mp3Le plus courant

.wavSans perte

.mp4Audio vidéo

.m4aAppareils Apple

.movQuickTime

.oggOpen source

.mpgaAudio MPEG

.mpegAudio MPEG

.opusBas débit

.flacQualité studio

.aacStreaming

.webmEnregistrements web

.wmaWindows

.aviVidéo

.mtsVidéo AVCHD

.m4vVidéo Apple

.mkvVidéo Matroska

.wmvVidéo Windows

.flvVidéo Flash

.3gpVidéo mobile

Exporter vers

.pdfPrêt à imprimer

.docxDocument Word

.mdMarkdown

.srtSous-titres

.htmlPage web

Pour votre métier

Conçu pour ceux qui travaillent avec des mots.

Journalistes, chercheurs, équipes RH : dès qu'un enregistrement implique plusieurs intervenants, la diarisation fait gagner un temps précieux.

Transcription d'interview pour journalistes et rédactions

Transcription d'interview, sans saisir une ligne

“Chaque intervenant identifié”
“Citations prêtes à extraire”
“Transcription précise en quelques minutes”

Guide

Tout savoir sur l'identification des locuteurs

Qu'est-ce que la diarisation des locuteurs ?

La diarisation (ou identification des locuteurs) est une technique d'analyse audio qui segmente un enregistrement en fonction des différents intervenants. Chaque segment de parole est étiqueté avec un identifiant de locuteur et un horodatage, ce qui permet de savoir précisément qui a parlé, quand et pendant combien de temps.

Cette technologie est particulièrement utile pour les enregistrements à plusieurs voix : interviews, réunions, tables rondes, entretiens ou podcasts. Elle transforme un fichier audio brut en un document structuré, lisible et consultable.

Comment fonctionne la détection automatique des voix ?

Vook analyse les caractéristiques acoustiques de chaque segment de parole, notamment la fréquence fondamentale, le timbre et le rythme, pour distinguer les voix les unes des autres. L'IA regroupe ensuite les segments similaires sous un même identifiant de locuteur.

Segmentation. l'audio est découpé en segments homogènes selon les changements de locuteur.
Regroupement. les segments appartenant à la même voix sont associés sous un label commun (Locuteur 1, Locuteur 2, etc.).
Horodatage. chaque segment reçoit un timestamp de début et de fin pour une navigation précise.

Quels types de fichiers sont compatibles ?

Vook accepte 20 formats audio et vidéo : MP3, WAV, MP4, M4A, MOV, OGG et bien d'autres. La taille maximale par fichier est de 6 Go, sans limite de durée. Les fichiers audio comme vidéo sont pris en charge.

Pour les fichiers vidéo (MP4, MOV, WEBM), Vook extrait automatiquement la piste audio avant de lancer la diarisation. Aucune conversion préalable n'est nécessaire de votre côté.

Précision et limites de la diarisation

Sur un audio clair avec des intervenants distincts, Vook atteint une précision de transcription jusqu'à 99 %. La diarisation est particulièrement fiable lorsque les voix ne se chevauchent pas et que l'enregistrement est de bonne qualité.

Chevauchements de voix. la précision baisse lorsque plusieurs personnes parlent en même temps.
Enregistrements téléphoniques. la compression audio réduit les informations acoustiques disponibles pour distinguer les voix.
Accents forts. certains accents régionaux peuvent affecter la transcription, mais l'éditeur intégré permet une correction rapide.

Corriger et exporter un transcript avec locuteurs

Une fois la diarisation terminée, l'éditeur intégré de Vook vous permet de renommer les locuteurs (remplacer « Locuteur 1 » par le prénom réel), de fusionner des segments mal attribués, de corriger les erreurs de transcription et de masquer des noms sensibles avant le partage.

L'export conserve les labels de locuteurs et les timestamps dans tous les formats disponibles : PDF, DOCX, MD, SRT et HTML. Vous pouvez ainsi réutiliser le transcript directement dans votre outil de rédaction, de recherche ou d'archivage.

Confidentialité et conformité RGPD

Les enregistrements contenant plusieurs voix sont souvent sensibles : entretiens RH, interviews de sources, réunions confidentielles. Vook est conçu pour protéger ces données dès la conception.

Hébergement en France. vos fichiers ne quittent pas le territoire européen et ne sont pas soumis au Cloud Act américain.
Chiffrement AES-256. au repos, vos données sont illisibles pour tout tiers.
Droit à l'effacement. suppression de vos données sur demande, à tout moment, conformément au RGPD.
Aucun entraînement de modèle. vos enregistrements ne sont jamais utilisés pour améliorer les modèles d'IA de Vook.

FAQ

Foire aux questions

Vous avez une question différente et vous ne trouvez pas la réponse que vous cherchez ? Contactez-nous.

Qu'est-ce que l'identification des locuteurs (diarisation) ?

La diarisation est le processus qui consiste à détecter automatiquement les différents intervenants dans un enregistrement et à attribuer chaque segment de parole au bon locuteur. Vook étiquette chaque prise de parole (Locuteur 1, Locuteur 2, etc.) avec un horodatage précis. Vous pouvez ensuite renommer ou fusionner des locuteurs dans l'éditeur intégré.

Combien de locuteurs Vook peut-il identifier dans un même fichier ?

Vook identifie automatiquement plusieurs locuteurs dans un même enregistrement. Le nombre exact dépend de la qualité audio et de la clarté des prises de parole. Pour de meilleurs résultats, privilégiez des enregistrements où les voix ne se chevauchent pas.

Quels formats audio et vidéo sont acceptés ?

Vook accepte 20 formats audio et vidéo, dont MP3, WAV, MP4, M4A, MOV et OGG, jusqu'à 6 Go par fichier. Les fichiers audio et vidéo sont tous pris en charge.

La diarisation fonctionne-t-elle dans toutes les langues ?

Vook prend en charge 100+ langues, dont le français, l'anglais, l'espagnol, l'allemand, l'italien et le portugais. L'identification des locuteurs est active quelle que soit la langue prise en charge dans le fichier.

Mes fichiers sont-ils en sécurité sur Vook ?

Vos fichiers sont chiffrés en AES-256 au repos et hébergés en France. Vook ne les utilise jamais pour entraîner ses modèles et ne les revend pas.

Puis-je corriger les erreurs d'attribution de locuteur ?

Oui. L'éditeur intégré vous permet de corriger les erreurs de transcription, de renommer les locuteurs, de fusionner des segments mal attribués et de masquer des noms sensibles. Vous pouvez ensuite ré-exporter le fichier corrigé en PDF, DOCX, MD, SRT ou HTML.

Faut-il créer un compte pour utiliser l'identification des locuteurs ?

Non. Vous pouvez effectuer 1 transcription avec identification des locuteurs gratuitement par jour, sans inscription et sans carte bancaire. Pour des fichiers plus longs, des conversions illimitées et l'accès à Vook Chat, des plans payants sont disponibles.

Plan gratuit

Une transcription gratuite par jour. Choisissez votre offre pour plus de puissance.

Abonnez-vous sans engagement

4 mois gratuits avec un abonnement annuel

API plan

Intégrez Vook.ai à votre stack

Tarif et fonctionnalités sur mesure

Découvrir

Accès API dédié
Fonctionnalités sur mesure
Facturation centralisée

Crédits à vie

Pass 10 heures - sans abonnement

Utilisez ces heures quand vous voulez, elles n'expirent jamais

3€

par heure

Acheter des heures

Identifiez vos locuteurs maintenant

Gratuit pour un usage occasionnel. Sans carte bancaire. Un fichier par jour, tous les jours, à vie.

Essayez maintenant

Outils de conversion liés

Transcription horodatée Transcription fichier volumineux Transcription confidentielle MP3 en texte MP4 en texte WAV en texte