parakeet-mlx
Przeczytaj oryginałThis article introduces parakeet-mlx, a project that brings NVIDIA's Parakeet Automatic Speech Recognition (ASR) model to Apple's MLX framework. It's packaged as a Python CLI tool, allowing users to transcribe audio files locally. The post details the initial model download size (2.5GB) and provides a performance benchmark, noting a 53-second transcription time for a 1-hour podcast with high-quality results.
Komentarze
Brak komentarzy
Bądź pierwszy, który podzieli się swoimi myślami!
Rozszerzenie przeglądarki
Uzyskaj natychmiastowy dostęp do AllDevBlogs z przeglądarki
Tydzień
1
Dokumentowanie decyzji projektowych – o ADR i RFC
DevSzczepaniak
•
2 głosów
2
Gemini CLI – co to jest i jak działa nowe narzędzie od Google dla programistów
UProgramisty Piotr Kolasiński
•
1 głosów