Zamiana audio na tekst lokalnie na komputerze - Whisper AI + GPU
YouTubeZamiana audio na tekst, wykorzystującą modele Whisper AI i obsługującą układy GPU, dzięki programowi na Windows o nazwie WhisperDesktop.
program: https://github.com/Const-me/Whisper/releases
model językowy: https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main
(im większy model to w teorii dokładniejszy - co nie zawsze się sprawdza, ale wolniejszy)(dla j. angielskiego wybrać model _en)
Na moim teście model medium (GPU 2GB) obrabiał 18 minutowe audio PL 13 minut.
Na modelu large -1 godzinę i 14 minut.
Oprócz zamiany audio z pliku, można też używać mikrofonu na żywo, a także tłumaczyć z innych języków.
Podobne programy:
Speech Translate: https://www.youtube.com/watch?v=JkCUVUfpg50
Subtitle Edit (z wbudowana obsługą Whisper) https://www.youtube.com/watch?v=timx-wIGRwk
Buzz: https://www.youtube.com/watch?v=2NDwOoV62-k
#ai #audio2text #rozpoznawaniemowy
program: https://github.com/Const-me/Whisper/releases
model językowy: https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main
(im większy model to w teorii dokładniejszy - co nie zawsze się sprawdza, ale wolniejszy)(dla j. angielskiego wybrać model _en)
Na moim teście model medium (GPU 2GB) obrabiał 18 minutowe audio PL 13 minut.
Na modelu large -1 godzinę i 14 minut.
Oprócz zamiany audio z pliku, można też używać mikrofonu na żywo, a także tłumaczyć z innych języków.
Podobne programy:
Speech Translate: https://www.youtube.com/watch?v=JkCUVUfpg50
Subtitle Edit (z wbudowana obsługą Whisper) https://www.youtube.com/watch?v=timx-wIGRwk
Buzz: https://www.youtube.com/watch?v=2NDwOoV62-k
#ai #audio2text #rozpoznawaniemowy