in

Les services de transcription en ligne sont-ils sûrs et privés?

MaximTrukhin / Shutterstock

La transcription était autrefois un processus manuel et fastidieux. Les médecins, les journalistes et un large éventail de professionnels enregistraient leurs notes et conversations sur une bande Dictaphone éraflée, puis s’asseyaient devant leur ordinateur pour les taper.

Avance rapide jusqu’en 2020, et il existe une variété de services que vous pouvez utiliser pour transformer un enregistrement audio en texte sur un écran d’ordinateur. Cependant, une question demeure: sont-ils sûrs? Après tout, vous téléchargez peut-être des enregistrements vocaux de conversations sensibles et de messages vocaux privés.

Jetons un coup d’œil à ces services et comment vous pouvez protéger vos informations.

Fonctionnement des services de transcription audio

Les services de transcription audio ont tendance à se diviser en trois camps. Le premier est entièrement piloté par ordinateur et utilise des modèles d’IA et d’apprentissage automatique existants pour traiter la conversation. Le second est le plus cher car les gens font le gros du travail. Le troisième est une combinaison de traitement informatique et d’humains.

Il est fort probable que vous soyez le plus familier avec la première catégorie. Services de transcription vocale, comme ceux proposés par Google, Apple et Otter.ai: Convertissez les ondes analogiques créées par votre voix en une représentation numérique. Il les divise ensuite en petits segments (parfois un millième de seconde) et les associe à des «phonèmes» connus ou à des éléments d’une langue.

Ces algorithmes tentent ensuite de les examiner dans le contexte d’autres phonèmes et de les soumettre à des modèles statistiques et IA qui produisent finalement du texte. Étant donné que ces services de transcription sont entièrement gérés par ordinateur, ils ont tendance à être les moins coûteux à exécuter. Cependant, la précision n’est pas toujours au rendez-vous, en particulier lorsqu’il s’agit d’extraire du texte à partir d’environnements bruyants ou à plusieurs personnes.

La transcription humaine implique des plates-formes dédiées, comme Tour, qui connectent les clients à un pool de transcripteurs pré-approuvés. Vous pouvez également embaucher quelqu’un sur un marché indépendant, comme Upwork ou Fiverr, à transcrire pour vous.

Enfin, il y a le mélange des deux. Pour accélérer le processus de transcription, certains sites permettent à l’IA de faire le travail préliminaire, puis quelqu’un nettoie la sortie et corrige les erreurs.

Les services de transcription se comportent mal

Un doigt touchant un haut-parleur Amazon Echo.r.classen / Shutterstock

Ces dernières années, de nombreux services de transcription ont fait l’objet de violations et de scandales.

Le plus ancien (et sans doute le plus choquant) était peut-être SpinVox, qui, dans les années 2000, offrait un service qui transformait les messages vocaux en messages SMS. À l’époque, cela était considéré comme une véritable avancée technologique. L’entreprise a rapidement attiré une presse positive, des clients et de vastes douves de financement.

Le problème? À l’insu des clients, leurs messages vocaux étaient traitées par des personnes travaillant dans des bureaux dans des endroits comme le Pakistan, l’île Maurice et l’Afrique du Sud. Un initié de l’entreprise a affirmé que seulement 2% des messages vocaux étaient traités par machine et que le reste était traité par environ 10 000 travailleurs exploités.

Lorsque les employés d’un bureau pakistanais de SpinVox n’étaient pas payés, ils ont commencé à envoyer des messages directement aux clients pour protester. Finalement, la vérité est sortie et SpinVox a perdu une grande partie de sa valeur. Finalement, les restes de l’entreprise ont été vendus à Nuancer, l’un des plus grands fournisseurs de reconnaissance vocale au monde.

Plus récemment, le journaliste de cybersécurité, Brian Krebs, a découvert une brèche majeure survenue chez MEDantex, un fournisseur de services de transcription vocale basé au Kansas pour les professionnels de la santé. Comme on pouvait s’y attendre, des données (dont certaines remontaient à 2007) contenant des dossiers médicaux sensibles ont été divulguées. Le contenu peut être téléchargé à partir d’un portail non sécurisé sous forme de fichiers Microsoft Word.

Même les services de transcription numérique ne sont pas sûrs. Après tout, lorsque vous utilisez un service entièrement informatisé, l’entreprise peut faire appel à des entrepreneurs humains pour effectuer le contrôle de la qualité.

En 2019, site d’actualité belge, VRT NWS, a découvert que les sous-traitants de Google écoutaient les conversations entre des individus et leurs assistants intelligents Google Home. Un entrepreneur a même permis à VRT NWS d’accéder à des conversations, dont beaucoup étaient de nature profondément sensible (et, dans certains cas, sexuellement intime).

Amazon, Apple et Microsoft utilisaient également des sous-traitants de cette manière. En d’autres termes, quelqu’un peut écouter des enregistrements vocaux de votre assistant virtuel.

Les services de transcription en ligne sont-ils sûrs?

Une femme portant des écouteurs et en tapant sur un ordinateur portable.ImageFlow / Shutterstock

La question la plus pertinente est de savoir si les services de transcription en ligne sont sûrs. Malheureusement, la réponse est un peu compliquée.

L’espace de transcription vocale est, à ce stade, largement mature. Les mauvais acteurs les plus flagrants ont été éliminés.

Néanmoins, lorsque vous confiez vos données (dans ce cas, des conversations privées) à un tiers, vous comptez sur lui pour les protéger. Cela est tout aussi vrai pour les services en ligne que pour les transcripteurs humains.

En fin de compte, vous devez vous demander deux choses: faites-vous confiance au service et dans quelle mesure vos conversations sont-elles sensibles?

Lorsque vous recherchez un service de transcription, cela vaut toujours la peine de faire des recherches. L’entreprise a-t-elle une bonne réputation? Est-ce bien établi? A-t-il fait l’objet d’une violation de données dans le passé? Existe-t-il une politique de confidentialité qui précise explicitement comment vos données seront traitées et sécurisées?

Comme nous l’avons mentionné précédemment, les services basés sur l’IA dépendent souvent des employés et des sous-traitants tiers pour effectuer des contrôles de qualité. Bien que ces vérifications ne représentent qu’une fraction de toutes les transcriptions, il est toujours possible que quelqu’un écoute votre conversation.

Dans de nombreux cas, cependant, ce n’est pas un facteur décisif. Cependant, si votre conversation est profondément privée ou commercialement sensible, vous pouvez envisager d’ouvrir un éditeur de texte et de transcrire à l’ancienne.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Devriez-vous acheter des objectifs de caméra spécifiques aux capteurs de culture?

Devriez-vous acheter des objectifs de caméra spécifiques aux capteurs de culture?

Une nouvelle batterie d'ordinateur portable peut-elle se détériorer si elle n'est pas utilisée?

Une nouvelle batterie d’ordinateur portable peut-elle se détériorer si elle n’est pas utilisée?