Skript für Ansagen in mp3-Dateien

stephan · 16. September 2020 um 12:38

Probiere es mal mit dem öffentlichen Key aus dem verlinken Posting. Da musst du nichts extra einrichten.

Zugegeben, es ist nicht so einfach und nach einem Jahr auch nicht mehr kostenlos (nen komplettes Set erzeugen kosten 0,01$). Ich stelle die Dateien deswegen ja auch zur Verfügung (vorallem weil da die Lizenz Lage relativ klar ist).

Ist sie absolut nicht. Ich ranke die Engines momentan so:

Google/Amazon (tun sich IMHO nichts)
say von macOS
gTTS

Manuel · 16. September 2020 um 12:41

Werde ich mal machen. Danke für den Link!

Wenn du das schon sagst

OK. Alles klar. Dann werde ich mal den verlinkten Google Key nehmen.

stephan · 16. September 2020 um 13:38

Ich hab mal eine Hörprobe aller 4 Engines hochgeladen. Könnt ihr selber mal vergleichen. Link hällt 48h.

Das Probehören ist beendet.

Dave · 16. September 2020 um 14:54

Danke fürs Teilen, jetzt verstehe ich was du meinst. Im direkten Vergleich ist Google TTS mMn immer noch am besten. Klingt am natürlichsten und ist am besten verständlich.
Zwischen MacOS say und Polly könnte ich mich jetzt ehrlich gesagt nicht entscheiden.
gTTS würde ich aber definitiv keiner der anderen Optionen vorziehen. Klingt doch ziemlich synthetisch und etwas abgehackt.

himmel9 · 16. September 2020 um 16:59

Bevor ich das Script kannte, habe ich händisch versucht die Titel über Internetseiten als MP3 zu generieren und dann vor die Höhrspiele zu packen.
Die kostenlosen Stimmen klangen alle noch schlimmer
Deshalb fand ich gTTS nicht so schlimm. Aber im Vergleich mit den anderen 3 ist es eindeutig das schlechteste. Schade eigentlich.
Außerdem habe ich festgestellt, dass zusammengesetzte Wörter manchmal buchstabiert werden. Keine Ahnung warum, aber durch trennen der Wörter mit Bindestrich oder Leerezichen läßt sich das abstellen.

Thomas-Lehnert · 16. September 2020 um 19:01

Ja die Unterschiede sind schon erheblich, zumindest was gtts betrifft.

Manuel · 16. September 2020 um 20:11

Dem stimme ich auch zu. Wobei ich doch erstaunt bin, dass say garnicht mal sooo schlecht klingt.

Thorsten_L · 17. September 2020 um 05:00

Habt ihr bei say mal die verschiedenen Stimmen ausprobiert? Ich finde da gibt es auch nochmal einen enormen Unterschied in der Qualität.
Allerdings ist der Umgang mit englischen Worten in deutschen Texten z.T. gruselig (z.T. Dann wieder gut )
Kann einer was zu Google und Amazon sagen, wie das da ist?

stephan · 17. September 2020 um 06:31

Naja es ist für jede Sprache ja im Prinzip eine andere Stimme. Wenn du mit —lang eine andere Sprache wählst wird automatisch je nach Dienst die passende Stimme gewählt, das hatte @Til damals praktischerweise so eingebaut. Teilweise gibt es mehrere Möglichkeiten, ich hab halt die gewählt, die mir am besten gefallen hat als ich das für fr (Achtung: Hierfür gibt es kein Sprachfile), nl und es erweitert habe:

github.com

seisfeld/TonUINO/blob/60a75f9cb10261ba1296d2e75b43b470cbaebce4/tools/text_to_speech.py#L19-L40


sayVoiceByLang = {
    'de': 'Anna',
    'en': 'Samantha',
    'fr': 'Thomas',
    'nl': 'Claire',
    'es': 'Monica'
}
googleVoiceByLang = {
    'de': { 'languageCode': 'de-DE', 'name': 'de-DE-Wavenet-C' },
    'en': { 'languageCode': 'en-US', 'name': 'en-US-Wavenet-C' },
    'fr': { 'languageCode': 'fr-FR', 'name': 'fr-FR-Wavenet-C' },
    'nl': { 'languageCode': 'nl-NL', 'name': 'nl-NL-Wavenet-A' },
    'es': { 'languageCode': 'es-ES', 'name': '' }
}
amazonVoiceByLang = {
    # See: https://docs.aws.amazon.com/de_de/polly/latest/dg/voicelist.html
    'de': 'Vicki',
    'en': 'Joanna',
    'fr': 'Celine',
    'nl': 'Lotte',

This file has been truncated. show original

Thorsten_L · 17. September 2020 um 07:37

Also ich meinte schon innerhalb einer Sprache.
Für Deutsch gibt es glaube ich zur Zeit 5 Stimmen oder so, die sich eben auch in den Pausen und Betonungen unterscheiden.

stephan · 17. September 2020 um 07:50

Genau, jetzt bezogen auf say gefällt mir Anna am besten, deswegen ist die in meinem Repo eben voreingestellt.

Manuel · 10. November 2020 um 22:55

Ich bekomme folgende Fehlermeldung nach Eingabe der Zeile:
python add_lead_in_messages.py -i "B:\Music\1 Tonuino\Astrid Lindgren\Mehr von uns Kindern aus Bullerbü CD1\01_Wir Kinder aus Bullerbü.mp3" -o "B:\Tonuino\tmp\02\011_01_Wir_Kinder_aus_Bullerbue.mp3" --file-regex "Mehr von uns Kindern aus Bullerbü CD1" --use-google-key="API key xyz"

Traceback (most recent call last):
  File "add_lead_in_messages.py", line 135, in <module>
    addLeadInMessage(args.input, args.output)
  File "add_lead_in_messages.py", line 76, in addLeadInMessage
    text = re.sub(fileRegex, titlePattern, inputFileName).replace('_', ' ').strip()
  File "C:\Users\AppData\Local\Programs\Python\Python37-32\lib\re.py", line 194, in sub
    return _compile(pattern, flags).sub(repl, string, count)
  File "C:\Users\AppData\Local\Programs\Python\Python37-32\lib\re.py", line 311, in _subx
    template = _compile_repl(template, pattern)
  File "C:\Users\AppData\Local\Programs\Python\Python37-32\lib\re.py", line 302, in _compile_repl
    return sre_parse.parse_template(repl, pattern)
  File "C:\Users\AppData\Local\Programs\Python\Python37-32\lib\sre_parse.py", line 1012, in parse_template
    addgroup(int(this[1:]), len(this) - 1)
  File "C:\Users\AppData\Local\Programs\Python\Python37-32\lib\sre_parse.py", line 956, in addgroup
    raise s.error("invalid group reference %d" % index, pos)
re.error: invalid group reference 1 at position 1

Ich vermute, dass hier wieder die - und _ im Dateinamen das Problem verursachen. Kann man das im Skript irgendwie anpassen? Kenne mich mit Python nicht aus um das selbst zu lösen.

Gute_Laune · 10. November 2020 um 23:17

Bei mir waren Leerzeichen mal ein Problem. Versuche mal, ob du ohne Leerzeichen auch die Fehlermeldung bekommst. Bei mir werden Leerzeichen als Trennung zwischen Parametern interpretiert.
Edit: hier waren es auch die - und _

Manuel · 11. November 2020 um 05:04

Ohne die Anführungszeichen gab es bei mir auch Probleme mit den Leerzeichen. Aber das sollte jetzt nicht mehr das Problem sein. Werde es aber trotzdem mal testen.

Genau, daher meine Vermutung…

Und das ist meine Hoffnung:

Manuel · 12. November 2020 um 09:24

Mittlerweile weiß ich, woran es liegt. Die Leerzeichen sind es nicht. Auch das - und _ nicht.

Das Problem wird durch --file-regex verursacht. @stephan, @Dave, hattet ihr das mal probiert bzw. läuft das bei euch?

stephan · 12. November 2020 um 09:27

Was sollen wir probiert haben?

Manuel · 12. November 2020 um 09:28

Den Zusatz mit --file-regex. Ich würde gerne einen eigenen Namen vorgeben.

stephan · 12. November 2020 um 09:32

Negativ, habe ich nie benutzt.

Manuel · 12. November 2020 um 09:33

Hmm, ok. Dann gibt es da wohl einen Bug. Muss mir einen Workaround überlegen.

Til · 12. November 2020 um 10:50

Die --file-regex wird zusammen mit --title-pattern verwendet.

Beispiel

Das Verzeichnis sieht so aus:

+- 04_Michel
    +- 001_Michel_Folge 1_Michel in der Suppenschüssel.mp3
    +- 002_Michel_Folge 2_Michel muss mehr Männchen machen.mp3
    +- 003_Michel_Folge 3_Michel bringt die Welt in Ordnung.mp3

Aufruf:

python add_lead_in_messages.py -i '04_Michel' -o my-target --use-amazon --file-regex '.*_Folge \d+_(.*)' --title-pattern '\1'

Dann wird folgendes angesagt:

Michel in der Suppenschüssel
Michel muss mehr Männchen machen
Michel bringt die Welt in Ordnung