Застосунки для диктування: порівняння voice-to-text рішень на базі Whisper та LLM
Я тут писав раніше про апки для диктування. Останній місяць я диктую більше ніж ввожу з клавіатури. І на ноуті і на тел.
Особливо це прикольно з аішкою (клод код, наприклад), коли йому надиктував шо треба зробити, кнопку нажав і займаєшся своїми справами, а воно робиться).
А ще зручно на тел за кермом.
Зробив табличку порівняння в ПДФ більшості апок для переводу голосу в текст на базі різних моделей. Там і посилання і деталі станом на сьогодні. ПДФ в коментарі закину
Для мене ще критично, щоб модель якісно розуміла мікс мов в 1 реченні. Наприклад українська + англ. До речі тому локальний безкоштовний whisper (навіть ультра) не дуже підходить із мого досвіду субʼєктивно.
🌊 А ще я тестую українську голосом класикою:
Реве та стогне Дніпр широкий
Сердитий вітер завива,
Додолу верби гне високі,
Горами хвилю підійма.
На цьому сипеться більшість моделей))
Наразі юзаю Speakly від Genpark поки вона безкоштовна.
Whisper — відкрита модель розпізнавання мовлення від OpenAI; підтримує багато мов і суміші мов; використовується як локальна (без хмари) або хмарна основа для voice-to-text застосунків.
Які застосунки для диктування (voice-to-text) є на Mac і iOS?
Чи можна диктувати українською та англійською в одному реченні?
Сподобалось? Це лише один пост. Більше думок про ШІ, технології й творчість — щодня в каналі.
Підписатися в Telegram