Neues Soundmodul (Charlie) für den TONuino

A.d.i · 4. Oktober 2023 um 11:52

Hallo liebe Community,

nachdem ich jetzt schon einige TONuino’s gebaut habe (und mich immer an der Community orientieren konnte). Großes DANKE übrigens hier an die Community dachte ich mir ich gebe mal etwas zurück.

Ich fand schon immer, dass das Soundmodul ein wenig blechern klingt und dachte mir ich gebe mir mal den Versuch dem Soundmodul einen neuen „Touch“ zu verpassen, und was soll ich sagen… herausgekommen ist Charlie. Das männliche pendant zur aktuellen TONuino Stimme.
Angepasst an die aktuelle TNG Version.

Ich habe die den Feiertag (3. Oktober) mal effektiv genutzt und ein (männliches) Soundmodul kreiert.

Es hat ab und an einen ungewöhnlichen Charakter, da die Intonation variiert (klingt an manchen stellen noch etwas seltsam) aber hey… man kann nicht alles haben

Bei denjenigen bei denen ich das Interesse geweckt habe, anbei der Github Link:

[Link wurde entfernt, da das Modul mit Bauteilen (Buttonboard) des Tonuinos nicht richtig funktioniert]

Viel Spaß beim probieren

LG

A.d.i

An die Mods: sollte ich in irgendeiner Form mit diesem Post gegen Regeln des Forums verstoßen haben bitte ich dies zu entschuldigen. Bei Bedarf bitte den kompletten Post löschen. Danke

Boerge1 · 4. Oktober 2023 um 15:34

Interessant wäre noch, womit du das generiert hast.

A.d.i · 4. Oktober 2023 um 15:37

Hi Boerge1,

die Seite heißt https://elevenlabs.io war ne Mordsarbeit

LG

Gute_Laune · 4. Oktober 2023 um 17:07

Nur als Hinweis du hast einige Dateien zweimal. Teilweise zweimal einen ähnlichen Text. Teilweise hast du die advert-Ansage auch im mp3 Ordner, dadurch sind noch mehr Nummern doppelt vergeben. Sowas macht ja leider schnell Probleme.

Ich habe die eben mal nebenbei durchlaufenlassen. Teilweise fällt der gute Charlie ja neben seiner irritierenden Aussprache auch ganz ins Englische. Das finde ich sehr anstrengend zu hören. Ich habe ein wenig den Eindruck bei den kurzen Ansagen fehlt es an Kontext, sodass die Emotion oft sehr übertrieben wirkt.

Hast du die teils geänderten Texte so vorgegeben? Also als Beispiel das „Viel Spaß“ nach „Ok ich habe die Karte konfiguriert“.
Andersherum fehlte meine ich die Ergänzung zum 3x3 Buttonboard beim Konfigurieren der Shortcuts.

A.d.i · 4. Oktober 2023 um 17:19

ja hatte ich so vorgegeben, das Problem daran ist, dass die Sprecher englisch sind (deutsche Sprecher fehlen hier komplett…) und ich die Texte so abändern musste, dass daraus eine deutsche Betonung wurde, da er ansonsten die englische (in dem Fall australische) Betonung nehmen würde und von der Intonation teilweiße extrem abgefallen ist… gut, war ein Versuch, aus Schaden wird man klug

Gute_Laune · 4. Oktober 2023 um 17:41

Das ist natürlich schade, wenn man nicht wie bei den bisher genutzten Text-to-Speech Tools die Sprache mit vorgeben kann. Grundsätzlich finde ich eine menschlichere Stimme schon interessant. In den Menüs finde ich das gar nicht so entscheidend, aber für die Ansagen, die auch der Nutzer (Kind) zu hören bekommt. Also sowas wie die Stopptanz-Ansage. Das finde ich etwas Begeisterung in der Stimme super!
Nur finde ich es schwierig, wenn man bei der Textwahl dann darauf so sehr Rücksicht nehmen muss.

A.d.i · 4. Oktober 2023 um 17:48

Deshalb auch die doppelten Einträge der Dateien, denn manchmal kam der Sprecher in der Stimme so hoch, das konnte man keinem zumuten, da musste ich dann einen Kompromiss finden welches noch am ehesten verständlich ist.

Thorsten · 29. Oktober 2023 um 00:14

Die haben ja auch eine Python Lib. Könnte man ja mal in die Firmware einbauen.

Schaue ich mir mal an.

A.d.i · 29. Oktober 2023 um 11:43

Danke @Thorsten,

ich habe mir das mal angeschaut und ein kleines Skript geschrieben:

#imports
import elevenlabs

#API-Key (falls vorhanden)
#elevenlabs.set_api_key("API-Key")

voice = elevenlabs.Voice(
# Sprecher
	voice_id = "IKne3meq5aSn9XLyUdCD",
	
	settings = elevenlabs.VoiceSettings(
		
# Wert 0 - 1
# 1 ist sehr stabil was langweilig klingen könnte.
# 0 sehr ausdrucksstark, fast emotional
		stability = 0.25,
		
#similarity_boost
#defaut 0.75
#keinen signifikanten Unterschied zu hoeren. Hoehere Werte haben ein paar seltsame Gerauesche
#hat evtl. Effekt mit voice_clone?
		similarity_boost = 0.75
	)
)
audio = elevenlabs.generate(
# Text, der gesprochen werden soll
    text = "Hi, Ich bin aus dem Weltall", 	
	
# Codec-Modell
	model = "eleven_multilingual_v1"        
)

#um ein audio abzuspielen: play
elevenlabs.play(audio)

#um ein audio zu speichern
#elevenlabs.play(audio, "text.mp3")


'''
Sprachmodelle
Adam: pNInz6obpgDQGcFmaJgB
Antoni: ErXwobaYiN019PkySvjV
Arnold: VR6AewLTigWG4xSOukaG
Bella: EXAVITQu4vr4xnSDxMaL
Callum: N2lVS1w4EtoT3dr4eOWO
Charlie: IKne3meq5aSn9XLyUdCD
Charlotte: XB0fDUnXU5powFXDhCwa
Clyde: 2EiwWnXFnvU5JabPnv8n
Daniel: onwK4e9ZLuTAKqWW03F9
Dave: CYw3kZ02Hs0563khs1Fj
Domi: AZnzlk1XvdvUeBnXmlld
Dorothy: ThT5KcBeYPX3keUQqHPh
Elli: MF3mGyEYCl7XYWbV9V6O
Emily: LcfcDJNUP1GQjkzn1xUU
Ethan: g5CIjZEefAph4nQFvHAz
Fin: D38z5RcWu1voky8WS1ja
Freya: jsCqWAovK2LkecY7zXl4
Gigi: jBpfuIE2acCO8z3wKNLl
Giovanni: zcAOhNBS3c14rBihAFp1
Glinda: z9fAnlkpzviPz146aGWa
Grace: oWAxZDx7w5VEj9dCyTzz
Harry: SOYHLrjzK2X1ezoPC6cr
James: ZQe5CZNOzWyzPSCn5a3c
Jeremy: bVMeCyTHy58xNoL34h3p
Jessie: t0jbNlBVZ17f02VDIeMI
Joseph: Zlb1dXrM653N07WRdFW3
Josh: TxGEqnHWrfWFTfGW9XjX
Liam: TX3LPaxmHKxFdv7VOQHJ
Matilda: XrExE9yKIg1WjnnlVkGX
Matthew: Yko7PKHZNXotIFUBG7I9
Michael: flq6f7yk4E4fJM5XTYuZ
Mimi: zrHiDhphv9ZnVXBqCLjz
Nicole: piTKgcLEGmPE4e6mEKli
Patrick: ODq5zmih8GrVes37Dizd
Rachel: 21m00Tcm4TlvDq8ikWAM
Ryan: wViXBPUzp2ZZixB1xQuM
Sam: yoZ06aMxZJJ28mfd3POQ
Serena: pMsXgVXv3BLzUgSXRplE
Thomas: GBv7mTt0atIp3Br8iCZE
'''

vielleicht hilft das jemandem

LG

A.d.i