Рубрики
Без рубрики

Голос в текст, используя транскрибирование AWS с помощью Python

Думаете, как использовать AWS, транскрибируйте с Python для голоса, чтобы текст? Вот краткое руководство, которое объясняет процесс простыми шагами. Tagged с AWS, Python, Speechtotext.

Boto3 – это комплект разработки программного обеспечения Amazon Web Services (AWS) для Python, который позволяет Разработчики Python Для написания программного обеспечения, которое использует веб -сервисы Amazon, такие как S3 и EC2.

Amazon Transcribe – это служба автоматического распознавания речи (ASR), которая полностью управляется и непрерывно обучается, которая генерирует точные транскрипты для аудиофайлов. Это позволяет разработчикам добавить речи к текстовым возможностям в свои приложения. Вы можете проанализировать аудиофайлы, хранящиеся в Amazon S3, и получить сервис вернуть текстовый файл транскрибированной речи с помощью API AMAZON Transcribe API. Обратитесь, чтобы узнать больше о Агентство веб -развития в Нью -Йорке Для различных способов улучшения или создания качества проектов и всей вашей компании.

  • Вам необходимо предоставить разрешения на использование консоли Amazon транскрибировать для действий, показанных в следующей политике:

1. Инициализировать клиент:

  • Запуск транскрибируйте задание инициализируйте клиента с помощью BOTO3 с помощью учетных данных AWS.

2. Запустить работу:

  • start_transcription_job (** kwargs) Это начнет асинхронную работу для транскрибирования речи в текст.

  • Требуемые параметры для запуска транскрибиальной работы являются TranscriptionJobname, Media, MediaFormat (‘mp3’ | ‘mp4’ | ‘wav’ | ‘flac’) , LanguageCode (‘en-us’ | ‘es-us’ | ‘en-au’ | ‘fr-ca’ | ‘en-gb’ | ‘de-de’ | ‘pt-br’ | ‘fr-fr’ | ” это-это) .

3. Проверьте статус работы:

  • Из -за асинхронного характера работы транскрипции нам нужно проверить статус работы. Время запуска работы транскрипции зависит от длины и сложности ваших записей.
  • Когда статус работы транскрипции завершен, результат ссылается на URL -адрес Amazon S3, который содержит транскрипцию в формате JSON:

4. Получить текст:

  • При полной транскрипции результат работы содержит транскрипцию в формате JSON. Используя библиотеку Python, загрузите ответ JSON и получите текст из результата.

Оригинал: “https://dev.to/botreetechnologies/voice-to-text-using-aws-transcribe-with-python-1cfc”