Ich habe die Powershell Skripte nun hier hochgeladen: https://github.com/ceear/Powershell.Text2Speech
Die sind noch nicht gut dokumentiert und es gibt ein paar Dinge zu beachten. Wäre gut, wenn ein Windows-User das mal (mit mir zusammen) testen könnte.
Grundsätzlich dient das Skript dazu Sprachdateien (MP3) mit verschiedenen Text-To-Speech Engines zu erstellen. Aktuell mit der Windows “Offline” Engine, Google TTS und Amazon Polly.
Für Google TTS und Amazon Polly werden entsprechende Konten/API-Keys benötigt.
-
Das eigentliche Skript ist
Generate-Speech-Files.ps1
-
Es erwartet eine Datei
speech.txt
als Eingabedatei für die zu erzeugenden Texte. -
Das Format der
speech.txt
ist so wie von stephan beschrieben :datei1.mp3|Text 1
-
Im oberen Breich von
Generate-Speech-Files.ps1
können einige Anpassungen vorgenommen werden.
**$Basepath = "C:\temp\MySpeech"
gibt den Zielordner der Sprachdateien an.
** Jede Speech-Engine kann mit $True / $False aktiviert oder deaktiviert werden.
** Für jede Sprach-Engine können die gewünschten Sprachen ausgewählt werden. -
Windows-Sprach-Engine
** Wenn ihr das Skript mit dem ParameterGenerate-Speech-Files.ps1 -ShowAvailableWinSpeechVoices
startet, zeigt es die aktuell in Windows verfügbaren Stimmen an. Die sind von der Sprachversion abhängig, können aber nachinstalliert werden:Microsoft
**$GenerateWinSpeechVoice="Microsoft Hedda Desktop"
Definiert dann die Stimmen. Hedda scheint eine Standardstimme zu sein. Hier können auch mehrere Stimmen angegeben werden="Stimme1","Stimme2",...
** Die Windows Engine erzeugt WAV Dateien. Ich verwende FFMPEG für die Konvertierung zu MP3. Unter$FFMPEGPath = "C:\windows\system32\ffmpeg.exe"
muss der Path zu FFMPEG eingetragen werden. Download z.B. hier : FFMPEG -
Google TTS
** API-KEY erstellen Link und unter$GoogleAPIToken
eintragen. die anderen Parameter sind im Skript dokumentiert. -
Amazon Polly
** Hier verwende ich die Amazon Powershell Module. Link
** Auch hierfür benötigt man einen Amazon-Account
** Einrichtung: Anleitung