Speech-to-Text nutzen

Was ist Speech-to-Text in basebox?

Mit der Spracherkennung in basebox können Sie gesprochene Inhalte automatisch in Text umwandeln. Das spart Zeit beim Tippen und ermöglicht es Ihnen, auch unterwegs oder in Situationen zu arbeiten, in denen Schreiben unpraktisch ist.

Zwei Möglichkeiten stehen zur Verfügung:

Live-Aufnahme über Ihr Mikrofon
Audio-Datei Upload für bereits vorhandene Aufnahmen

Methode 1: Live-Spracheingabe über Mikrofon

Wann nützlich: Für spontane Eingaben, Notizen oder wenn Sie lieber sprechen als tippen.

So nutzen Sie die direkte Spracheingabe:

Mikrofon-Symbol finden - Klicken Sie auf das Mikrofon-Symbol 🎤 neben dem Senden-Button im Chat
Browser-Berechtigung erteilen - Erlauben Sie basebox den Zugriff auf Ihr Mikrofon (erscheint beim ersten Mal)
Sprache auswählen - Wählen Sie zwischen Deutsch oder Englisch
Aufnahme starten - Die Aufnahme beginnt automatisch nach der Sprachauswahl
Deutlich sprechen - Sprechen Sie klar und in normalem Tempo
Aufnahme beenden - Die Aufnahme stoppt automatisch nach ca. 1 Minute oder Sie beenden sie manuell
Text überprüfen - Der gesprochene Inhalt wird automatisch als Text im Chat eingefügt

Was passiert danach: Sie können den transkribierten Text wie eine normale Texteingabe verwenden - bearbeiten, ergänzen oder direkt senden.

Browser-Berechtigungen verstehen:

Beim ersten Mal fragt Ihr Browser nach Mikrofon-Zugriff:

Chrome/Edge: Popup oben links mit "Zulassen" oder "Blockieren"
Firefox: Benachrichtigung in der Adressleiste
Safari: Berechtigung in den Browser-Einstellungen

Wichtig: Ohne Mikrofon-Berechtigung funktioniert die Live-Aufnahme nicht.

Methode 2: Audio-Datei hochladen und transkribieren

Wann nützlich: Für Meetings, Interviews, Vorträge oder andere bereits aufgenommene Inhalte.

So transkribieren Sie Audio-Dateien:

Datei vorbereiten - Stellen Sie sicher, dass Ihre Audio-Datei in einem unterstützten Format vorliegt
Upload starten - Ziehen Sie die Datei per Drag & Drop in den Chat-Bereich
Verarbeitung abwarten - basebox analysiert die Datei automatisch (kann je nach Länge einige Minuten dauern)
Transkription erhalten - Der Text erscheint im Chat
Mit Text arbeiten - Nutzen Sie den transkribierten Text für weitere Analysen oder Bearbeitungen

Unterstützte Audio-Formate:

WAV - Unkomprimierte Qualität (beste Ergebnisse)
MP3 - Komprimiert, weit verbreitet
FLAC - Verlustfreie Komprimierung
OGG - Open-Source Format

Maximale Dateigröße: 10 MB pro Datei

Tipps für optimale Erkennungsqualität

Für Live-Aufnahmen:

Umgebung optimieren:

✅ Ruhige Umgebung - Minimieren Sie Hintergrundgeräusche
✅ Gutes Mikrofon - Nutzen Sie ein Headset oder externes Mikrofon wenn möglich
✅ Stabiler Abstand - Halten Sie ca. 20-30 cm Abstand zum Mikrofon

Sprechweise anpassen:

✅ Deutlich artikulieren - Sprechen Sie klar und nicht zu schnell
✅ Normale Lautstärke - Nicht flüstern, nicht schreien
✅ Pausen machen - Kurze Pausen zwischen Sätzen helfen der Erkennung

Für Audio-Dateien:

Aufnahmequalität:

✅ Hohe Audioqualität - Mindestens 16 kHz Abtastrate
✅ Mono oder Stereo - Beide werden unterstützt
✅ Geringe Komprimierung - WAV oder FLAC für beste Ergebnisse

Inhalt optimieren:

✅ Ein Sprecher - Funktioniert am besten mit einer Person
✅ Klare Sprache - Dialekte können die Genauigkeit beeinträchtigen
✅ Kurze Segmente - Teilen Sie sehr lange Aufnahmen auf

Unterstützte Sprachen

Aktuell verfügbar:

Deutsch - Optimiert für deutsche Sprache und Begriffe
Englisch - Für englischsprachige Inhalte

Sprachauswahl: Die Sprache wird automatisch erkannt oder kann manuell ausgewählt werden.

Häufige Probleme und Lösungen

Mikrofon funktioniert nicht:

Problem: Keine Aufnahme möglich
Lösungen:

Browser-Berechtigungen prüfen und neu erteilen
Mikrofon in den Systemeinstellungen aktivieren
Anderen Browser testen
Seite neu laden und erneut versuchen

Schlechte Erkennungsqualität:

Problem: Text ist fehlerhaft oder unvollständig
Lösungen:

Deutlicher und langsamer sprechen
Hintergrundgeräusche reduzieren
Mikrofon-Abstand anpassen
Andere Sprache auswählen

Audio-Datei wird nicht verarbeitet:

Problem: Upload funktioniert nicht
Lösungen:

Dateiformat prüfen (WAV, MP3, FLAC, OGG)
Dateigröße unter 10 MB halten
Datei in anderes Format konvertieren
Browser-Cache leeren

Praktische Anwendungsfälle

Für Meetings und Besprechungen:

Live-Notizen während Videokonferenzen
Meeting-Protokolle aus Aufnahmen erstellen
Action Items schnell diktieren

Für Content-Erstellung:

Blog-Artikel diktieren statt tippen
Ideen sammeln unterwegs per Sprachmemo
Interviews transkribieren für weitere Bearbeitung

Für Dokumentation:

Arbeitsschritte verbal dokumentieren
Projektberichte sprechen statt schreiben
Kundengespräche nachbearbeiten

Nach der Transkription: Text weiter nutzen

Was Sie mit dem transkribierten Text machen können:

Direkt bearbeiten - Fehler korrigieren und ergänzen
Zusammenfassen lassen - basebox kann den Text analysieren
Strukturieren - In Stichpunkte oder Kapitel gliedern
Übersetzen - In andere Sprachen übertragen
Weiterverarbeiten - Als Basis für andere Dokumente nutzen

⚠️ Wichtiger Hinweis: Die Erkennungsqualität hängt stark von der Audioqualität und Sprechweise ab. Überprüfen Sie den transkribierten Text immer auf Richtigkeit, besonders bei wichtigen Dokumenten.

Tipp: Beginnen Sie mit kurzen Testaufnahmen, um ein Gefühl für die optimalen Einstellungen zu bekommen.

Probleme mit der Spracherkennung oder Fragen zur Audioqualität? → Support kontaktieren