SPEECH Eingabequellen (Browser, RTMP & API) – Video.Taxi Hilfe

In einer SPEECH Session wird dein Audio in Text umgewandelt. Woher das Audiosignal kommt, kannst du in der Session über den Reiter "Ingest" (Eingabequelle) bestimmen.

Standardmäßig sendest du das Signal direkt von dem Browser aus, in dem du Session gerade geöffnet hast, indem du oben rechts auf "Audioübertragung starten" drückst und die Audioquelle auswählst.

Es gibt auch die Möglichkeit, die Speech Session (und die Audioübertragung) über unsere API-Schnittstellen zu steuern. Mehr dazu erfährst du hier.

Außerdem kannst du das Audiosignal von einem Livestream-Encoder senden. Um das zu machen, musst du die RTMP-URL und den Streamschlüssel in deinen Encoder eingeben. Diese findest du im Bereich "Ingest" unter "RTMP" - von dort aus kannst du sie einfach copy & pasten.

Hast du die Daten in deinen Encoder eingefügt (hier unten siehst du, wie es im virtuellen Encoder "OBS" aussieht), startest du den Stream in deinem Encoder und in der SPEECH Session kommt dann das Audiosignal an und wird transkribiert.

Verwandte Beiträge