Speech-to-Text nutzen

Sprache in Text umwandeln mit basebox

Was ist Speech-to-Text in basebox?

Mit der Spracherkennung in basebox können Sie gesprochene Inhalte automatisch in Text umwandeln. Das spart Zeit beim Tippen und ermöglicht es Ihnen, auch unterwegs oder in Situationen zu arbeiten, in denen Schreiben unpraktisch ist.

Zwei Möglichkeiten stehen zur Verfügung:

  • Live-Aufnahme über Ihr Mikrofon

  • Audio-Datei Upload für bereits vorhandene Aufnahmen

Methode 1: Live-Spracheingabe über Mikrofon

Wann nützlich: Für spontane Eingaben, Notizen oder wenn Sie lieber sprechen als tippen.

So nutzen Sie die direkte Spracheingabe:

  1. Mikrofon-Symbol finden - Klicken Sie auf das Mikrofon-Symbol 🎤 neben dem Senden-Button im Chat

  2. Browser-Berechtigung erteilen - Erlauben Sie basebox den Zugriff auf Ihr Mikrofon (erscheint beim ersten Mal)

  3. Sprache auswählen - Wählen Sie zwischen Deutsch oder Englisch

  4. Aufnahme starten - Die Aufnahme beginnt automatisch nach der Sprachauswahl

  5. Deutlich sprechen - Sprechen Sie klar und in normalem Tempo

  6. Aufnahme beenden - Die Aufnahme stoppt automatisch nach ca. 1 Minute oder Sie beenden sie manuell

  7. Text überprüfen - Der gesprochene Inhalt wird automatisch als Text im Chat eingefügt

Was passiert danach: Sie können den transkribierten Text wie eine normale Texteingabe verwenden - bearbeiten, ergänzen oder direkt senden.

Browser-Berechtigungen verstehen:

Beim ersten Mal fragt Ihr Browser nach Mikrofon-Zugriff:

  • Chrome/Edge: Popup oben links mit "Zulassen" oder "Blockieren"

  • Firefox: Benachrichtigung in der Adressleiste

  • Safari: Berechtigung in den Browser-Einstellungen

Wichtig: Ohne Mikrofon-Berechtigung funktioniert die Live-Aufnahme nicht.

Methode 2: Audio-Datei hochladen und transkribieren

Wann nützlich: Für Meetings, Interviews, Vorträge oder andere bereits aufgenommene Inhalte.

So transkribieren Sie Audio-Dateien:

  1. Datei vorbereiten - Stellen Sie sicher, dass Ihre Audio-Datei in einem unterstützten Format vorliegt

  2. Upload starten - Ziehen Sie die Datei per Drag & Drop in den Chat-Bereich

  3. Verarbeitung abwarten - basebox analysiert die Datei automatisch (kann je nach Länge einige Minuten dauern)

  4. Transkription erhalten - Der Text erscheint im Chat

  5. Mit Text arbeiten - Nutzen Sie den transkribierten Text für weitere Analysen oder Bearbeitungen

Unterstützte Audio-Formate:

  • WAV - Unkomprimierte Qualität (beste Ergebnisse)

  • MP3 - Komprimiert, weit verbreitet

  • FLAC - Verlustfreie Komprimierung

  • OGG - Open-Source Format

Maximale Dateigröße: 10 MB pro Datei

Tipps für optimale Erkennungsqualität

Für Live-Aufnahmen:

Umgebung optimieren:

  • Ruhige Umgebung - Minimieren Sie Hintergrundgeräusche

  • Gutes Mikrofon - Nutzen Sie ein Headset oder externes Mikrofon wenn möglich

  • Stabiler Abstand - Halten Sie ca. 20-30 cm Abstand zum Mikrofon

Sprechweise anpassen:

  • Deutlich artikulieren - Sprechen Sie klar und nicht zu schnell

  • Normale Lautstärke - Nicht flüstern, nicht schreien

  • Pausen machen - Kurze Pausen zwischen Sätzen helfen der Erkennung

Für Audio-Dateien:

Aufnahmequalität:

  • Hohe Audioqualität - Mindestens 16 kHz Abtastrate

  • Mono oder Stereo - Beide werden unterstützt

  • Geringe Komprimierung - WAV oder FLAC für beste Ergebnisse

Inhalt optimieren:

  • Ein Sprecher - Funktioniert am besten mit einer Person

  • Klare Sprache - Dialekte können die Genauigkeit beeinträchtigen

  • Kurze Segmente - Teilen Sie sehr lange Aufnahmen auf

Unterstützte Sprachen

Aktuell verfügbar:

  • Deutsch - Optimiert für deutsche Sprache und Begriffe

  • Englisch - Für englischsprachige Inhalte

Sprachauswahl: Die Sprache wird automatisch erkannt oder kann manuell ausgewählt werden.

Häufige Probleme und Lösungen

Mikrofon funktioniert nicht:

Problem: Keine Aufnahme möglich
Lösungen:

  • Browser-Berechtigungen prüfen und neu erteilen

  • Mikrofon in den Systemeinstellungen aktivieren

  • Anderen Browser testen

  • Seite neu laden und erneut versuchen

Schlechte Erkennungsqualität:

Problem: Text ist fehlerhaft oder unvollständig
Lösungen:

  • Deutlicher und langsamer sprechen

  • Hintergrundgeräusche reduzieren

  • Mikrofon-Abstand anpassen

  • Andere Sprache auswählen

Audio-Datei wird nicht verarbeitet:

Problem: Upload funktioniert nicht
Lösungen:

  • Dateiformat prüfen (WAV, MP3, FLAC, OGG)

  • Dateigröße unter 10 MB halten

  • Datei in anderes Format konvertieren

  • Browser-Cache leeren

Praktische Anwendungsfälle

Für Meetings und Besprechungen:

  • Live-Notizen während Videokonferenzen

  • Meeting-Protokolle aus Aufnahmen erstellen

  • Action Items schnell diktieren

Für Content-Erstellung:

  • Blog-Artikel diktieren statt tippen

  • Ideen sammeln unterwegs per Sprachmemo

  • Interviews transkribieren für weitere Bearbeitung

Für Dokumentation:

  • Arbeitsschritte verbal dokumentieren

  • Projektberichte sprechen statt schreiben

  • Kundengespräche nachbearbeiten

Nach der Transkription: Text weiter nutzen

Was Sie mit dem transkribierten Text machen können:

  • Direkt bearbeiten - Fehler korrigieren und ergänzen

  • Zusammenfassen lassen - basebox kann den Text analysieren

  • Strukturieren - In Stichpunkte oder Kapitel gliedern

  • Übersetzen - In andere Sprachen übertragen

  • Weiterverarbeiten - Als Basis für andere Dokumente nutzen

⚠️ Wichtiger Hinweis: Die Erkennungsqualität hängt stark von der Audioqualität und Sprechweise ab. Überprüfen Sie den transkribierten Text immer auf Richtigkeit, besonders bei wichtigen Dokumenten.

Tipp: Beginnen Sie mit kurzen Testaufnahmen, um ein Gefühl für die optimalen Einstellungen zu bekommen.


Probleme mit der Spracherkennung oder Fragen zur Audioqualität? → Support kontaktieren