Amazon Transcribe adalah layanan pengenalan suara yang mengonversi file audio menjadi teks.

Layanan ini menggunakan pembelajaran mesin dan memungkinkan pengembang untuk menambahkan kemampuan konversi suara-ke-teks ke dalam aplikasi. Misalnya, seorang pengembang dapat membuat aplikasi yang menggunakan Amazon Transcribe untuk membuat transkripsi panggilan layanan pelanggan di pusat kontak, atau menghasilkan subtitle untuk konten audio atau video secara real-time.

Cara Menggunakan Amazon Transcribe

Untuk menggunakan Amazon Transcribe, pengembang harus memiliki akun AWS dan membuat pengguna AWS Identity and Access Management. Setelah itu, layanan ini dapat diakses melalui AWS Management Console, AWS Command Line Interface (CLI), atau API Transcribe.

File audio yang digunakan dalam Transcribe harus diunggah dan disimpan di S3 dalam format MP3, MP4, WAV, atau FLAC, dengan durasi maksimum dua jam. Layanan ini mendukung aliran audio dengan frekuensi 16 kilohertz (kHz) dan 8 kHz.

Pengembang harus menentukan bahasa dan format file audio yang ingin ditranskripsi. Saat pertama kali diluncurkan pada pertengahan 2018, Transcribe hanya mendukung bahasa Inggris AS dan Spanyol, tetapi kini telah berkembang dengan mendukung lebih dari 30 bahasa, termasuk Bahasa Indonesia.

Fitur Lain dari Amazon Transcribe

Amazon Transcribe menggunakan pembelajaran mendalam untuk menambahkan tanda baca dan pemformatan ke dalam teks hasil transkripsi guna mengurangi kebutuhan pengeditan lebih lanjut. Layanan ini juga menghasilkan cap waktu untuk setiap kata, memungkinkan pengguna untuk kembali ke bagian tertentu dalam audio asli.

Transcribe dapat mengenali dan membedakan antara dua hingga sepuluh pembicara dalam satu file audio, serta memungkinkan pengembang memasukkan daftar kosakata khusus—misalnya istilah teknis atau nama khusus—agar transkripsi lebih akurat.

Amazon Transcribe kini terintegrasi dengan berbagai layanan Amazon lainnya, seperti Amazon Comprehend untuk pemrosesan bahasa alami (NLP), Amazon Translate untuk penerjemahan bahasa, dan Amazon Polly untuk mengonversi teks menjadi suara.

Harga dan Ketersediaan Amazon Transcribe

Amazon Transcribe menggunakan model pembayaran sesuai pemakaian, berdasarkan durasi audio yang ditranskripsi per bulan. AWS menawarkan tingkat gratis yang memungkinkan analisis hingga 60 menit audio setiap bulan selama satu tahun. Setelah melewati batas ini, biaya yang dikenakan adalah $0.0004 per detik.

Amazon juga menetapkan batas minimum 15 detik untuk setiap permintaan API Transcribe, sehingga audio dengan durasi di bawah 15 detik tetap akan dikenakan biaya 15 detik.

Hingga 2024, Amazon Transcribe tersedia di berbagai wilayah global, termasuk:

  • US-East-1 (Virginia Utara)
  • US-East-2 (Ohio)
  • US-West-2 (Oregon)
  • CA-Central-1 (Montreal)
  • EU-West-1 (Irlandia)
  • AP-Southeast-2 (Sydney)
  • AP-Northeast-1 (Tokyo)
  • AP-South-1 (Mumbai)
  • SA-East-1 (São Paulo)

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *