TRVAudioPlayer.SpeechToTextProperty

Содержит свойства, настраивающие распознавание речи.

property UseFFMpeg: Boolean;

Для распознавания речи требуется FFmpeg 8 или новее со встроенной моделью Whisper, а также файл модели, указываемый в свойстве SpeechToTextProperty.ModelFileName.

Распознавание речи запускается при присвоении Recording = True, если SpeechToTextProperty.Active = True. Оно останавливается при присвоении Recording = False.

Если свойство OutputFileName не пусто, распознавание речи выполняется одновременно с записью, используя параметры звука, заданные свойствами Encode*.

Если OutputFileName пусто, распознавание выполняется без записи. В этом случае свойства Encode* игнорируются, а звук обрабатывается как монофонический поток с 16-битными сэмплами и частотой дискретизации 16000 Гц.

Результат распознавания речи выдаётся в событии OnSpeechRecognized.