Transcrivez et identifiez chaque locuteur automatiquement.

Vook attribue chaque prise de parole au bon intervenant avec une précision jusqu'à 99 %, horodatage inclus. Vos fichiers sont hébergés en France, fichiers audio supprimés après 7 jours.

Choisi par plus de 65 000 utilisateurs
99% de précision
1 transcription gratuite par jour
Avec ou sans abonnement
Précision en conditions optimales
99 %
Par heure d'audio
< 1 min
Langues prises en charge
6
Professionnels
65k+

Comment ça marche

Trois étapes pour une transcription avec locuteurs identifiés

Aucun logiciel à installer, aucun formulaire à remplir. Déposez votre fichier, on s'occupe du reste.

1

Déposez votre fichier

Glissez-déposez votre fichier ou choisissez-le depuis votre ordinateur. Fichiers jusqu'à 6 Go acceptés, sans installation.

2

Vook.ai transcrit en quelques minutes

Vook.ai détecte les locuteurs, ajoute les horodatages, et produit une transcription propre et ponctuée. Généralement moins d'une minute par heure d'audio.

3

Modifiez, exportez, interrogez

Relisez dans notre éditeur, exportez en PDF, DOCX, MD, SRT ou HTML, et demandez au chat de résumer, extraire des citations ou identifier les thèmes.

Pourquoi Vook.ai

L'IA de transcription qui ne lit pas vos données.

La souveraineté européenne n'est pas une option, c'est notre fondation. Vos fichiers restent les vôtres : chiffrés, hébergés en UE, jamais utilisés pour l'entraînement.

Hébergé en UE

Vos fichiers restent sur une infrastructure française et ne traversent jamais l'Atlantique. Conforme RGPD, aucune exposition au Cloud Act.

Chiffrement AES-256

Chiffrement AES-256 au repos. Vous seul accédez à vos transcriptions.

Jamais utilisé pour l'entraînement

Vos audios et transcriptions ne sont jamais utilisés pour l'entraînement, jamais revendus, jamais analysés pour la publicité.

Conforme RGPD

Conçu dès le premier jour pour la conformité européenne. DPA sur demande, audit complet, droit à l'effacement respecté.

Formats

Tous vos fichiers audio et vidéo acceptés

Vook.ai lit tous les formats audio et vidéo courants, et exporte vers ce dont votre flux a besoin.

Nous avons conçu la diarisation de Vook pour que chaque voix soit traçable, chaque segment vérifiable, et chaque fichier effacé dès que vous n'en avez plus besoin.
Équipe ingénierie Vook.ai

Formats d'entrée

.mp3Le plus courant
.wavSans perte
.mp4Audio vidéo
.m4aAppareils Apple
.movQuickTime
.oggOpen source
.mpgaAudio MPEG
.mpegAudio MPEG
.opusBas débit
.flacQualité studio
.aacStreaming
.webmEnregistrements web
.wmaWindows
.aviVidéo
.mtsVidéo AVCHD
.m4vVidéo Apple
.mkvVidéo Matroska
.wmvVidéo Windows
.flvVidéo Flash
.3gpVidéo mobile

Exporter vers

.pdfPrêt à imprimer
.docxDocument Word
.mdMarkdown
.srtSous-titres
.htmlPage web

Pour votre métier

Conçu pour ceux qui travaillent avec des mots.

Journalistes, chercheurs, équipes RH : dès qu'un enregistrement implique plusieurs intervenants, la diarisation fait gagner un temps précieux.

Transcription d'interview pour journalistes et rédactions

Transcription d'interview, sans saisir une ligne

Chaque intervenant identifié

Citations prêtes à extraire

Transcription précise en quelques minutes

En savoir plus

Guide

Tout savoir sur l'identification des locuteurs

Qu'est-ce que la diarisation des locuteurs ?

La diarisation (ou identification des locuteurs) est une technique d'analyse audio qui segmente un enregistrement en fonction des différents intervenants. Chaque segment de parole est étiqueté avec un identifiant de locuteur et un horodatage, ce qui permet de savoir précisément qui a parlé, quand et pendant combien de temps.

Cette technologie est particulièrement utile pour les enregistrements à plusieurs voix : interviews, réunions, tables rondes, entretiens ou podcasts. Elle transforme un fichier audio brut en un document structuré, lisible et consultable.

Comment fonctionne la détection automatique des voix ?

Vook analyse les caractéristiques acoustiques de chaque segment de parole, notamment la fréquence fondamentale, le timbre et le rythme, pour distinguer les voix les unes des autres. L'IA regroupe ensuite les segments similaires sous un même identifiant de locuteur.

  • Segmentation. l'audio est découpé en segments homogènes selon les changements de locuteur.
  • Regroupement. les segments appartenant à la même voix sont associés sous un label commun (Locuteur 1, Locuteur 2, etc.).
  • Horodatage. chaque segment reçoit un timestamp de début et de fin pour une navigation précise.

Quels types de fichiers sont compatibles ?

Vook accepte 20 formats audio et vidéo : MP3, WAV, MP4, M4A, MOV, OGG et bien d'autres. La taille maximale par fichier est de 6 Go, sans limite de durée. Les fichiers audio comme vidéo sont pris en charge.

Pour les fichiers vidéo (MP4, MOV, WEBM), Vook extrait automatiquement la piste audio avant de lancer la diarisation. Aucune conversion préalable n'est nécessaire de votre côté.

Précision et limites de la diarisation

Sur un audio clair avec des intervenants distincts, Vook atteint une précision de transcription jusqu'à 99 %. La diarisation est particulièrement fiable lorsque les voix ne se chevauchent pas et que l'enregistrement est de bonne qualité.

  • Chevauchements de voix. la précision baisse lorsque plusieurs personnes parlent en même temps.
  • Enregistrements téléphoniques. la compression audio réduit les informations acoustiques disponibles pour distinguer les voix.
  • Accents forts. certains accents régionaux peuvent affecter la transcription, mais l'éditeur intégré permet une correction rapide.

Corriger et exporter un transcript avec locuteurs

Une fois la diarisation terminée, l'éditeur intégré de Vook vous permet de renommer les locuteurs (remplacer « Locuteur 1 » par le prénom réel), de fusionner des segments mal attribués, de corriger les erreurs de transcription et de masquer des noms sensibles avant le partage.

L'export conserve les labels de locuteurs et les timestamps dans tous les formats disponibles : PDF, DOCX, MD, SRT et HTML. Vous pouvez ainsi réutiliser le transcript directement dans votre outil de rédaction, de recherche ou d'archivage.

Confidentialité et conformité RGPD

Les enregistrements contenant plusieurs voix sont souvent sensibles : entretiens RH, interviews de sources, réunions confidentielles. Vook est conçu pour protéger ces données dès la conception.

  • Hébergement en France. vos fichiers ne quittent pas le territoire européen et ne sont pas soumis au Cloud Act américain.
  • Chiffrement AES-256. au repos, vos données sont illisibles pour tout tiers.
  • Suppression automatique. les fichiers audio sont effacés après 7 jours si vous ne les sauvegardez pas dans votre compte.
  • Aucun entraînement de modèle. vos enregistrements ne sont jamais utilisés pour améliorer les modèles d'IA de Vook.

FAQ

Foire aux questions

Vous avez une question différente et vous ne trouvez pas la réponse que vous cherchez ? Contactez-nous.

Qu'est-ce que l'identification des locuteurs (diarisation) ?

La diarisation est le processus qui consiste à détecter automatiquement les différents intervenants dans un enregistrement et à attribuer chaque segment de parole au bon locuteur. Vook étiquette chaque prise de parole (Locuteur 1, Locuteur 2, etc.) avec un horodatage précis. Vous pouvez ensuite renommer ou fusionner des locuteurs dans l'éditeur intégré.

Combien de locuteurs Vook peut-il identifier dans un même fichier ?

Vook identifie automatiquement plusieurs locuteurs dans un même enregistrement. Le nombre exact dépend de la qualité audio et de la clarté des prises de parole. Pour de meilleurs résultats, privilégiez des enregistrements où les voix ne se chevauchent pas.

Quels formats audio et vidéo sont acceptés ?

Vook accepte 20 formats audio et vidéo, dont MP3, WAV, MP4, M4A, MOV et OGG, jusqu'à 6 Go par fichier. Les fichiers audio et vidéo sont tous pris en charge.

La diarisation fonctionne-t-elle dans toutes les langues ?

Vook prend en charge 6 langues : le français, l'anglais, l'espagnol, l'allemand, l'italien et le portugais. L'identification des locuteurs est active quelle que soit la langue prise en charge dans le fichier.

Mes fichiers sont-ils en sécurité sur Vook ?

Vos fichiers sont chiffrés en AES-256 au repos et hébergés en France. Les fichiers audio sont supprimés automatiquement après 7 jours si vous ne les sauvegardez pas dans votre compte. Vook ne les utilise jamais pour entraîner ses modèles et ne les revend pas.

Puis-je corriger les erreurs d'attribution de locuteur ?

Oui. L'éditeur intégré vous permet de corriger les erreurs de transcription, de renommer les locuteurs, de fusionner des segments mal attribués et de masquer des noms sensibles. Vous pouvez ensuite ré-exporter le fichier corrigé en PDF, DOCX, MD, SRT ou HTML.

Faut-il créer un compte pour utiliser l'identification des locuteurs ?

Non. Vous pouvez effectuer 1 transcription avec identification des locuteurs gratuitement par jour, sans inscription et sans carte bancaire. Pour des fichiers plus longs, des conversions illimitées et l'accès à Vook Chat, des plans payants sont disponibles.

Plan gratuit

Une transcription gratuite par jour. Choisissez votre offre pour plus de puissance.

Crédits à vie

Pass 10 heures - sans abonnement

Utilisez ces heures quand vous voulez, elles n'expirent jamais

3$

par heure

Identifiez vos locuteurs maintenant

Gratuit pour un usage occasionnel. Sans carte bancaire. Un fichier par jour, tous les jours, à vie.

Essayez maintenant