
Whisper, OpenAI tarafından geliştirilen çok dilli bir konuşmadan yazıya çeviri (speech-to-text) modelidir. Bu makalede, Whisper’ın nasıl kurulacağını ve ses dosyalarından nasıl otomatik olarak metin çıkarabileceğinizi adım adım anlatıyoruz.
Whisper, kurulumdan sonra terminal veya komut satırı üzerinden doğrudan kullanılabilir. Örneğin, bir .mp3 ses dosyasını Türkçe olarak yazıya dökmek için şu komutu kullanabilirsiniz:
whisper dosyaadi.mp3 –language Turkish –model medium
Whisper’ı Python ile Kullanmak
Whisper’ı çalıştırmak için önce Python ortamınıza yüklemeniz gerekir. Bunun için terminalde aşağıdaki komutu çalıştırabilirsiniz:
pip install git+https://github.com/openai/whisper.git
Whisper, ses dosyalarını işlemek için arka planda FFmpeg adlı bir yazılıma ihtiyaç duyar.
qvb5h
şa