Seit ich über einen Kollegen von dem TonUINO-Projekt gehört habe, war ich von der intuitiven Menüführung über Sprachausgabe begeistert.
Da habe ich mich dann gleich gefragt, was nötig ist, um auch eine Spracheingabe, d.h. die Steuerung über gesprochene Sprache statt mit Tastern, zu ermöglichen. Man kennt das ja vom Handy, Smart-Speakern oder auch von Telefonhotlines.
Tatsächlich wusste ich von einem Arduino-Shield, der genau das ermöglicht: Der MOVI-Shield von Audeme versteht sprecherunabhängig bis zu 150 Befehle in natürlicher Sprache und muss dafür noch nicht einmal mit Sprachamples, sondern kann direkt mit Text-Strings angelernt werden. Auf dem Board werkelt ein Cortex A13 FPGA. Audeme sitzt in Kalifornien und einer der Entwickler ist Deutscher. Daher funktioniert MOVI auch mit Englisch, Spanisch und Deutsch. Die großen Nachteile sind aber, dass der Shield einen großen Arduino erfordert (Nano reicht nicht), 500mA bei 7-16V zieht, und mit 75$ einen stolzen Preis hat.
Nun habe ich eine deutlich preiswertere Option entdeckt: Das geetech Voice Recognition Module ist klein, verbrauchsarm (<40mA bei 5V), und kann bis zu 3 Gruppen mit je 5 Sprachbefehlen erkennen. Der Preis liegt auf Banggood bei derzeit nur 14,46€. Elektronisch kommuniziert es über UART. Eine Schritt-für-Schritt-Anleitung für den Arduino gibt es z.B. bei instructables.com.
Der Funktionsumfang ist natürlich deutlich eingeschränkter (nur 15Befehle, programmierbar über Voice-Samples) als bei MOVI, aber für einen sprachgesteuerten TonUINO dürfte das reichen.
Denkbar Befehle wie „Stopp“, „Weiter“, „Zurück“, „Lauter“, „Leiser“. Aber auch Antwortmöglichkeiten bei einem Quiz („A“, „B“, „C“) könnte man umsetzen. Man kann auch zum Aktivieren der Spracheingabe einen Aufweckbefehl („TonUINO!“) einführen.
Mir juckt es jedenfalls in den Fingern, das Geetech-Modul zu bestellen und einzubauen…
Bis dahin mache ich mir ersteinmal einen Earl Grey Tee, heiß. „Computer, …“