whisper
whisper - программа для распознания речи.
https://github.com/openai/whisper
Для установки необходимы:
-
ffmpeg:
Chocolatey - https://chocolatey.org/install
Открываешь командную строку с правами администратора. Правой кнопкой мыши по кнопке Пуск. Терминал (Администратор).
choco install ffmpeg
-
Python - https://www.python.org/downloads/
При установке Python нужно поставить галочку Add python.exe to PATH.
Установка:
Win+R cmd
pip install -U openai-whisper
Cкрипт для расшифровки:
import whisper
model = whisper.load_model("base")
options = whisper.DecodingOptions(language="ru")
result = model.transcribe(r"путь к медиафайлу")
with open("transcript.txt", "w", encoding="utf-8") as txt:
txt.write(result["text"])
Создай текстовый файл, вставь код, закрой. Поменяй название на w, расширение на .py.
Создай папку whisper. Помести в неё файл w.py.
Использование:
В файле w.py (открой его с помощью Блокнота) в строке
audio = whisper.load_audio(“название медиафайла с расширением”)
вставь название медиафайла с расширением.
В строке
result = model.transcribe(r”путь к медиафайлу”)
вставь путь к медиафайлу.
Установи язык в этой строке:
options = whisper.DecodingOptions(language=”ru”)
Win+R cmd
python путь к папке whisper\w.py
whisper для субтитров:
subsai - https://github.com/abdeladim-s/subsai
Установка:
pip install git+https://github.com/abdeladim-s/subsai
Скрипт:
from subsai import SubsAI
file = r"путь к медиафайлу"
subs_ai = SubsAI()
model = subs_ai.create_model('openai/whisper', {'model_type': 'base'})
subs = subs_ai.transcribe(file, model)
subs.save('название субтитров c .srt расширением')