Публикация была переведена автоматически. Исходный язык: Русский
Делал образовательный проект для детей. Аудиоуроки на казахском языке, но контента не хватало. Нанимать диктора на каждый текст — дорого. Записывать самому — акцент не тот, качество страдает.
Нашёл Zvukogram — российский сервис, у них голос "Айгуль" на казахском. Качество приемлемое, API простой. Сделал Telegram-бота: отправляешь текст, получаешь аудио.
Первая версия работала так: отправил текст → запрос в API → получил ID задачи → жду 5 секунд → проверяю готово ли → если нет, ещё 5 секунд → и так 120 попыток. Длинные тексты генерировались минуту-две. Я сидел, смотрел в телефон,
ждал. Неудобно, но работало.
Потом понял фишку: бот может сам ждать вместо меня. Отправляешь текст, бот пишет "Аудио генерациясы басталды. Күтіңіз..." — и сам проверяет каждые 5 секунд. Ты закрываешь телефон, идёшь чай пить, через две минуты приходит голосовое
сообщение. Магия.
Использовал для озвучки учебных материалов. Есть текст урока на казахском → вставляешь в бота → он возвращает аудио → загружаешь в образовательную платформу. Сделал так 50+ уроков за неделю. Диктор обошёлся бы в $1000, Zvukogram
API — $20.
Интересный момент: бот отправляет файлы как voice, не как audio. В Telegram это разные вещи. Voice — можно слушать прямо в чате, с ускорением, с паузами. Audio — это музыкальный плеер. Для обучения voice удобнее — дети не
переключаются в другое приложение.
Сейчас этот бот использую как личный инструмент. Нужно проверить как звучит текст на казахском — отправляю ему, он озвучивает. Вместо Google Translate с его роботизированным голосом, у меня нормальное произношение с правильными
интонациями.
Удивительно, как один API и 140 строк кода превращают текст в голос. Не нужны студии звукозаписи, не нужны микрофоны, не нужны редакторы аудио. Написал текст → получил голос. И всё это живёт в Telegram, где сидят все мои
пользователи.
Делал образовательный проект для детей. Аудиоуроки на казахском языке, но контента не хватало. Нанимать диктора на каждый текст — дорого. Записывать самому — акцент не тот, качество страдает.
Нашёл Zvukogram — российский сервис, у них голос "Айгуль" на казахском. Качество приемлемое, API простой. Сделал Telegram-бота: отправляешь текст, получаешь аудио.
Первая версия работала так: отправил текст → запрос в API → получил ID задачи → жду 5 секунд → проверяю готово ли → если нет, ещё 5 секунд → и так 120 попыток. Длинные тексты генерировались минуту-две. Я сидел, смотрел в телефон,
ждал. Неудобно, но работало.
Потом понял фишку: бот может сам ждать вместо меня. Отправляешь текст, бот пишет "Аудио генерациясы басталды. Күтіңіз..." — и сам проверяет каждые 5 секунд. Ты закрываешь телефон, идёшь чай пить, через две минуты приходит голосовое
сообщение. Магия.
Использовал для озвучки учебных материалов. Есть текст урока на казахском → вставляешь в бота → он возвращает аудио → загружаешь в образовательную платформу. Сделал так 50+ уроков за неделю. Диктор обошёлся бы в $1000, Zvukogram
API — $20.
Интересный момент: бот отправляет файлы как voice, не как audio. В Telegram это разные вещи. Voice — можно слушать прямо в чате, с ускорением, с паузами. Audio — это музыкальный плеер. Для обучения voice удобнее — дети не
переключаются в другое приложение.
Сейчас этот бот использую как личный инструмент. Нужно проверить как звучит текст на казахском — отправляю ему, он озвучивает. Вместо Google Translate с его роботизированным голосом, у меня нормальное произношение с правильными
интонациями.
Удивительно, как один API и 140 строк кода превращают текст в голос. Не нужны студии звукозаписи, не нужны микрофоны, не нужны редакторы аудио. Написал текст → получил голос. И всё это живёт в Telegram, где сидят все мои
пользователи.