Utiliser l'API Text-to-Speech avec C#

1. Présentation

L'API Google Cloud Text-to-Speech (bêta) permet aux développeurs d'intégrer une voix humaine synthétique aux sonorités naturelles en tant que contenu audio lisible dans leurs applications. L'API Text-to-Speech convertit une entrée au format texte ou dans le langage de balisage de synthèse vocale (SSML) en données audio au format MP3 ou LINEAR16 (encodage utilisé dans les fichiers WAV).

Dans cet atelier de programmation, vous allez vous concentrer sur l'utilisation de l'API Text-to-Speech avec C#. Vous apprendrez à lister les voix disponibles et à synthétiser des contenus audio à partir d'un texte.

Points abordés

  • Utiliser Cloud Shell
  • Activer l'API Text-to-Speech
  • Authentifier les requêtes API
  • Installer la bibliothèque cliente Google Cloud pour C#
  • Afficher les voix disponibles
  • Comment synthétiser des contenus audio à partir de texte

Prérequis

  • Un projet Google Cloud Platform
  • Un navigateur tel que Chrome ou Firefox
  • Bonne connaissance de C#

Enquête

Comment allez-vous utiliser ce tutoriel ?

Je vais le lire uniquement Je vais le lire et effectuer les exercices

Comment évalueriez-vous votre expérience avec C#?

Débutant Intermédiaire Expert

Quel est votre niveau d'expérience avec les services Google Cloud Platform ?

<ph type="x-smartling-placeholder"></ph> Débutant Intermédiaire Expert
.

2. Préparation

Configuration de l'environnement au rythme de chacun

  1. Connectez-vous à la console Google Cloud, puis créez un projet ou réutilisez un projet existant. (Si vous ne possédez pas encore de compte Gmail ou Google Workspace, vous devez en créer un.)

295004821bab6a87.png

37d264871000675d.png

96d86d3d5655cdbe.png

  • Le nom du projet est le nom à afficher pour les participants au projet. Il s'agit d'une chaîne de caractères non utilisée par les API Google. Vous pourrez toujours le modifier.
  • L'ID du projet est unique parmi tous les projets Google Cloud et non modifiable une fois défini. La console Cloud génère automatiquement une chaîne unique (en général, vous n'y accordez d'importance particulière). Dans la plupart des ateliers de programmation, vous devrez indiquer l'ID de votre projet (généralement identifié par PROJECT_ID). Si l'ID généré ne vous convient pas, vous pouvez en générer un autre de manière aléatoire. Vous pouvez également en spécifier un et voir s'il est disponible. Après cette étape, l'ID n'est plus modifiable et restera donc le même pour toute la durée du projet.
  • Pour information, il existe une troisième valeur (le numéro de projet) que certaines API utilisent. Pour en savoir plus sur ces trois valeurs, consultez la documentation.
  1. Vous devez ensuite activer la facturation dans la console Cloud pour utiliser les ressources/API Cloud. L'exécution de cet atelier de programmation est très peu coûteuse, voire sans frais. Pour désactiver les ressources et éviter ainsi que des frais ne vous soient facturés après ce tutoriel, vous pouvez supprimer le projet ou les ressources que vous avez créées. Les nouveaux utilisateurs de Google Cloud peuvent participer au programme d'essai sans frais pour bénéficier d'un crédit de 300 $.

Démarrer Cloud Shell

Bien que Google Cloud puisse être utilisé à distance depuis votre ordinateur portable, nous allons nous servir de Google Cloud Shell pour cet atelier de programmation, un environnement de ligne de commande exécuté dans le cloud.

Activer Cloud Shell

  1. Dans Cloud Console, cliquez sur Activer Cloud Shell d1264ca30785e435.png.

cb81e7c8e34bc8d.png

Si vous démarrez Cloud Shell pour la première fois, un écran intermédiaire vous explique de quoi il s'agit. Si un écran intermédiaire s'est affiché, cliquez sur Continuer.

d95252b003979716.png

Le provisionnement et la connexion à Cloud Shell ne devraient pas prendre plus de quelques minutes.

7833d5e1c5d18f54.png

Cette machine virtuelle contient tous les outils de développement nécessaires. Elle comprend un répertoire d'accueil persistant de 5 Go et s'exécute dans Google Cloud, ce qui améliore considérablement les performances du réseau et l'authentification. Une grande partie, voire la totalité, de votre travail dans cet atelier de programmation peut être effectué dans un navigateur.

Une fois connecté à Cloud Shell, vous êtes authentifié et le projet est défini sur votre ID de projet.

  1. Exécutez la commande suivante dans Cloud Shell pour vérifier que vous êtes authentifié :
gcloud auth list

Résultat de la commande

 Credentialed Accounts
ACTIVE  ACCOUNT
*       <my_account>@<my_domain.com>

To set the active account, run:
    $ gcloud config set account `ACCOUNT`
  1. Exécutez la commande suivante dans Cloud Shell pour vérifier que la commande gcloud connaît votre projet:
gcloud config list project

Résultat de la commande

[core]
project = <PROJECT_ID>

Si vous obtenez un résultat différent, exécutez cette commande :

gcloud config set project <PROJECT_ID>

Résultat de la commande

Updated property [core/project].

3. Activer l'API Text-to-Speech

Pour pouvoir commencer à utiliser l'API Text-to-Speech, vous devez l'activer. Vous pouvez activer l'API à l'aide de la commande suivante dans Cloud Shell:

gcloud services enable texttospeech.googleapis.com

4. Installer la bibliothèque cliente de l'API Google Cloud Text-to-Speech pour C#

Commencez par créer une application de console C# simple que vous utiliserez pour exécuter des exemples de l'API Text-to-Speech:

dotnet new console -n TextToSpeechApiDemo

L'application créée et les dépendances doivent être résolues:

The template "Console Application" was created successfully.
Processing post-creation actions...
...
Restore succeeded.

Accédez ensuite au dossier TextToSpeechApiDemo:

cd TextToSpeechApiDemo/

Ajoutez le package NuGet Google.Cloud.TextToSpeech.V1 au projet:

dotnet add package Google.Cloud.TextToSpeech.V1
info : Adding PackageReference for package 'Google.Cloud.TextToSpeech.V1' into project '/home/atameldev/TextToSpeechDemo/TextToSpeechDemo.csproj'.
log  : Restoring packages for /home/atameldev/TextToSpeechDemo/TextToSpeechDemo.csproj...
...
info : PackageReference for package 'Google.Cloud.TextToSpeech.V1' version '1.0.0-beta01' added to file '/home/atameldev/TextToSpeechDemo/TextToSpeechDemo.csproj'.

Vous êtes maintenant prêt à utiliser l'API Text-to-Speech.

5. Lister les voix disponibles

Dans cette section, vous allez d'abord lister toutes les voix disponibles en anglais pour la synthèse audio.

Commencez par ouvrir l'éditeur de code en haut à droite de Cloud Shell:

fd3fc1303e63572.png

Accédez au fichier Program.cs dans le dossier TextToSpeechApiDemo et remplacez le code par ce qui suit:

using Google.Cloud.TextToSpeech.V1;
using System;

namespace TextToSpeechApiDemo
{
    class Program
    {
        static void Main(string[] args)
        {
            var client = TextToSpeechClient.Create();
            var response = client.ListVoices("en");
            foreach (var voice in response.Voices)
            {
                Console.WriteLine($"{voice.Name} ({voice.SsmlGender}); Language codes: {string.Join(", ", voice.LanguageCodes)}");
            }
        }
    }
}

Prenez une ou deux minutes pour étudier le code*.* Retournez dans Cloud Shell, puis exécutez l'application:

dotnet run

Vous devriez obtenir le résultat suivant :

en-US-Wavenet-D (Male); Language codes: en-US
en-AU-Wavenet-A (Female); Language codes: en-AU
en-AU-Wavenet-B (Male); Language codes: en-AU
en-AU-Wavenet-C (Female); Language codes: en-AU
en-AU-Wavenet-D (Male); Language codes: en-AU
en-GB-Wavenet-A (Female); Language codes: en-GB
en-GB-Wavenet-B (Male); Language codes: en-GB
en-GB-Wavenet-C (Female); Language codes: en-GB
...
en-GB-Standard-A (Female); Language codes: en-GB
en-GB-Standard-B (Male); Language codes: en-GB
en-AU-Standard-D (Male); Language codes: en-AU

Résumé

Au cours de cette étape, vous avez réussi à lister toutes les voix disponibles en anglais pour la synthèse audio. Vous trouverez également la liste complète des voix disponibles sur la page Voix disponibles.

6. Synthétiser des contenus audio à partir de texte

Vous pouvez utiliser l'API Text-to-Speech pour convertir une chaîne en données audio. Vous pouvez configurer la sortie de la synthèse vocale de différentes manières, par exemple en sélectionnant une voix unique ou en modulant la hauteur, le volume, la vitesse d'élocution et le taux d'échantillonnage de la sortie.

Pour synthétiser un fichier audio à partir de texte, accédez au fichier Program.cs dans le dossier TextToSpeechApiDemo et remplacez le code par ce qui suit:

using Google.Cloud.TextToSpeech.V1;
using System;
using System.IO;

namespace TextToSpeechApiDemo
{
    class Program
    {
        static void Main(string[] args)
        {
            var client = TextToSpeechClient.Create();

            // The input to be synthesized, can be provided as text or SSML.
            var input = new SynthesisInput
            {
                Text = "This is a demonstration of the Google Cloud Text-to-Speech API"
            };

            // Build the voice request.
            var voiceSelection = new VoiceSelectionParams
            {
                LanguageCode = "en-US",
                SsmlGender = SsmlVoiceGender.Female
            };

            // Specify the type of audio file.
            var audioConfig = new AudioConfig
            {
                AudioEncoding = AudioEncoding.Mp3
            };

            // Perform the text-to-speech request.
            var response = client.SynthesizeSpeech(input, voiceSelection, audioConfig);
            
            // Write the response to the output file.
            using (var output = File.Create("output.mp3"))
            {
                response.AudioContent.WriteTo(output);
            }
            Console.WriteLine("Audio content written to file \"output.mp3\"");
        }
    }
}

Prenez une minute ou deux pour étudier le code et voir comment il permet de créer un fichier audio à partir de texte*.*

Retournez dans Cloud Shell, puis exécutez l'application:

dotnet run

Vous devriez obtenir le résultat suivant :

Audio content written to file "output.mp3"

Dans l'éditeur de code, vous pouvez télécharger le fichier MP3 et le lire localement sur votre ordinateur.

a4b9578505422dad.png

Résumé

Au cours de cette étape, vous avez pu utiliser l'API Text-to-Speech pour convertir une chaîne en fichier audio au format mp3. Découvrez comment créer des fichiers audio vocaux.

7. Félicitations !

Vous avez appris à utiliser l'API Text-to-Speech avec C# pour effectuer différents types de transcription sur des fichiers audio.

Effectuer un nettoyage

Afin d'éviter que des frais ne soient facturés sur votre compte Google Cloud Platform pour les ressources utilisées dans ce démarrage rapide, procédez comme suit :

  • Accédez à la console Cloud Platform.
  • Sélectionnez le projet que vous souhaitez arrêter, puis cliquez sur "Supprimer". en haut: la suppression du projet est programmée.

En savoir plus

Licence

Ce document est publié sous une licence Creative Commons Attribution 2.0 Generic.