Istilah-istilah yang sering digunakan dalam teknologi Conversational Voice AI - Urban - www.indonesiana.id
x

Talent digital di era disrupsi

Eva Rahayu

Penulis Indonesiana
Bergabung Sejak: 31 Agustus 2021

Kamis, 9 September 2021 17:15 WIB

  • Urban
  • Topik Utama
  • Istilah-istilah yang sering digunakan dalam teknologi Conversational Voice AI

    Terlepas dari ketenarannya yang meroket, Conversational Voice AI, atau Kecerdasan Artifisial yang mampu berkomunikasi secara verbal, belum benar-benar mendapatkan perhatian dari industri. Masih banyak yang belum paham bahasa-bahasa yang digunakan dalam dunia Voice AI. Artikel ini akan membahas bahasa, istilah, maupun singkatan terkait Voice AI.

    Dibaca : 475 kali

    Kecerdasan

    Terlepas dari ketenarannya yang meroket, Conversational Voice AI, atau kecerdasan artifisial yang mampu berkomunikasi secara verbal, belum benar-benar mendapatkan perhatian dari industri. Masih banyak yang belum paham bahasa-bahasa yang digunakan dalam dunia Voice AI. Artikel ini akan membahas bahasa, istilah, maupun singkatan terkait Voice AI

    Conversational Voice Artificial Intelligence: Kecerdasan Artifisial yang mampu berkomunikasi secara verbal

    Untuk memahami tentang hal-hal lain terkait Voice AI ada baiknya kita memahami apa itu Conversational Voice Artificial Intelligence atau yang juga dikenal sebagai Voice AI. Conversational Voice Artificial Intelligence terdiri dari beberapa hal yang dikenal dengan nama Voice Activated Machine atau teknologi yang dapat diaktifkan lewat suara seperti Siri dari apple, Google Home  Assistant, Alexa milik Amazon, atau Talkbots buatan WIZ.AI. Teknologi Voice AI ini memiliki fungsi yang mirip dengan chatbot yang biasanya menyapa anda ketika mengunjungi sebuah situs. 

    Dalam penggunaan Conversational Voice Artificial Intelligence pengguna tidak hanya dapat mengaktifkan teknologi tersebut dengan suara atau memberikan pertanyaan, Voice AI juga memiliki kemampuan untuk berbincang dengan pengguna dengan suara dan respons yang realistis layaknya manusia. Kemampuan unik yang dimiliki Kecerdasan Artifisial untuk memahami respons pengguna dengan konteks dan gaya bahasa tertentu ini mampu dicapai lewat teknologi Machine Learning, Natural Language Processing, Natural Language Understanding, dan Text to Speech Engine. Dengan memadukan teknologi-teknologi tersebut, pengguna dapat memiliki pengalaman berinteraksi yang natural dengan Kecerdasan Artifisial seperti saat berinteraksi dengan seseorang. 

     

    Apa itu Machine Learning?

    Machine Learning atau Pembelajaran Mesin merupakan bagian dari dunia Kecerdasan Buatan yang fokus pada penggunaan data dan algoritma untuk melatih mesin (Kecerdasan Buatan) mengimitasi manusia. Dalam hal ini, Machine Learning digunakan untuk melatih voice AI untuk dapat memberikan respon lebih akurat kepada pengguna. 



    Mengenal Lebih Jelas Natural Language Processing (NLP)

    Natural Language Processing (NLP) merupakan teknologi yang berfokus pada interaksi antara komputer (Mesin/AI) dengan bahasa yang digunakan manusia, yang dikenal dengan natural language. NLP memperbolehkan mesin untuk memahami bahasa tersebut, dalam bentuk lisan maupun tulisan (Speech Recognition). NLP juga memberikan komputer kemampuan untuk mengerti konteks sebuah percakapan serta gaya bahasa dari respon yang diberikan pengguna. kemampuan ini dikenal dengan istilah Intent Recognition atau kemampuan untuk mengenali niat dan maksud dari pengguna.

    Selain digunakan pada teknologi Speech Recognition, NLP merupakan aspek fundamental Kecerdasan Artifisial yang memberikan  komputer kemampuan untuk memahami ucapan manusia, mengolah informasi dari ucapan tersebut, dan menghasilkan informasi penting secara efisien. 

     

    Lalu apa bedanya NLP dengan Natural Language Understanding (NLU) ?

    Sebenarnya. Natural Language Understanding (NLU) adalah subtopik dari Natural Language Processing yang menggunakan sintaksis (tata kalimat) dan aturan gramatikal pada suatu bahasa untuk memahami respon yang diberikan oleh pengguna, termasuk konteks dari respon tersebut. NLU melibatkan proses seperti sentiment analysis dimana suatu kalimat dianalisis untuk mengetahui sentimen yang terkandung di dalamnya (bisa positif, negatif, atau neutral). Sering digunakan pada survei atau review pelanggan, teknologi NLU mampu memproses data secara cepat dan efisien, sekaligus juga memberikan pengetahuan yang lebih dalam sesuai dengan konteks dan sentimen saat melakukan analisa. NLU juga mampu mengkategorisasi informasi sesuai topik. Dalam aplikasinya di call center misalnya, NLU dapat memastikan bahwa pengguna dilanjutkan ke agen call center yang tepat tergantung kebutuhan layanan pelanggan yang dibutuhkan. 

     

    Fungsi Text To Speech (TTS) Dalam Memabangun Personalized Experience

    Text to speech (TTS) melibatkan penggunaan suara manusia untuk menghasilkan lafalan yang realistis dari tulisan menjadi kata-kata yang diucapkan. Salah satu contoh penggunaan TTS pada Kecerdasan Buatan untuk sistem Customer Service dapat dilihat saat nomor telepon pelanggan (yang spesifik bagi penelepon, dan berbeda untuk orang lain) harus disebutkan di dalam panggilan telepon untuk memberikan pengalaman personal bagi pelanggan. Pastinya akan sangat sulit jika harus meminta seorang pengisi suara untuk membacakan seluruh kombinasi nomor dalam pembuatan nomor identifikasi. Untuk itu, teknologi TTS mempercepat proses tersebut dengan kemampuannya untuk mengubah tulisan menjadi rekaman suara. Selain itu, teknologi TTS sederhana tetap membutuhkan usaha yang besar untuk membuat suara robot terdengar realistis dan natural, karena intonasi dan sentimen yang selalu ada pada percakapan kita sehari-hari. Karena itulah, bermunculan pengembang  yang memuat suara Voice AI Talkbot terdengar lebih natural.

     

    Membuat Transkripsi Secara Efisien Dengan Teknologi Speech to Text (STT)

    Berbalik dengan teknologi Text to Speech, Speech to Text merupakan teknologi yang mengubah ucapan menjadi text atau dikenal dengan istilah transkripsi. Dalam teknologi call center. proses ini dikenal juga dengan nama Automatic Speech Recognition (ASR), yang artinya “mencatat” atau “membuat transkripsi” panggilan telepon. Dengan adanya teknologi yang secara otomatis mentranskripsi panggilan telepon menjadi teks, akan lebih mudah bagi perusahaan untuk menganalisa dan membuat segmentasi pelanggan, yang merupakan hal penting dalam membuat strategi targeted marketing  untuk meningkatkan kesuksesan bisnis. Melakukan transkripsi telepon merupakan proses yang kadang membuat frustasi. selain itu, proses ini juga membutuhkan kemampuan mendengar yang baik, dan kemampuan menulis yang secepat kilat. Jadi, tidak heran jika otomatisasi proses ini dapat membuat bisnis lebih efisien dan memangkas pengeluaran.



    Mengatur Alur Percakapan Kecerdasan Buatan dengan Dialogue Management

    Dialog Management merupakan sebuah sistem yang mengatur alur percakapan. Untuk mengembangkan komputer (Mesin/AI) yang mampu berkomunikasi dengan pelanggan, sangat penting untuk membangun struktur alur perbincangan untuk memastikan pengalaman panggilan telepon terasa sangat intuitif dan realistis. Untuk mencapai hal tersebut, dibutuhkan analisis panggilan telepon yang terjadi di dunia nyata untuk memahami kebutuhan dan jalan pikiran pelanggan. Dialogue Management terdiri dari dua proses utama, yaitu: Pertama, adalah proses Dialog Modeling untuk memonitor kondisi sebuah dialog. Kedua, Dialog Control, dimana dialog manager menentukan bagaimana alur percakapan dengan A.I. akan berjalan. 



    Mengenal proses Interactive Voice Response (IVR)

    Seringkali, suara dering hotline customer service diikuti dengan instruksi seperti “Untuk pertanyaan terkait ___, tekan satu”, kemudian anda akan melanjutkan dengan menekan angka satu pada telepon anda. Input ini kemudian akan mengalihkan anda ke agen khusus yang akan membantu anda. Proses menginput angka pada telepon anda inilah yang disebut IVR; yaitu fitur dasar yang digunakan untuk mengelola panggilan telepon dan mengalihkan panggilan telepon ke agen yang sesuai. 

    Secara keseluruhan, komponen-komponen yang disebutkan tersebut berkolaborasi untuk membuat robot pintar yang mampu meningkatkan efisiensi biaya operasional, dan juga meningkatkan sales karena kemampuannya untuk mengaplikasikan best practice yang dimiliki agen customer service. Kemudian jika dipasangkan dengan mesin dan teknologi deep learning, inovasi teknologi Kecerdasan Buatan untuk percakapan akan menjadi lebih baik dengan setiap interaksi pelanggan dan panggilan telepon. Selain itu, setiap percakapan dengan pelanggan yang dicatat, didokumentasikan, dan dianalisis memperbolehkan perusahaan untuk mendapatkan pengetahuan mendalam tentang pelanggan dengan mudah. Informasi ini  akan sangat berguna dalam membangun pengalaman pelanggan yang lebih personal dan meningkatkan brand loyalty. 

    Tapi perlu diingat, walaupun Conversational Voice AI merupakan inovasi teknologi terdepan dan akan terus berkembang,  selalu dibutuhkan sentuhan manusia dalam usaha customer engagement terutama karena aspek sosial. Solusi terbaiknya adalah dengan menggabungkan keduanya, Conversational Voice AI untuk membantu pekerjaan berulang dengan rules tertentu, dan pilihan self-service bagi pelanggan. Sedangkan, Agen Call Center dapat  menghandle tugas-tugas yang lebih kompleks termasuk melayani pelanggan-pelanggan yang lebih penting.



    Suka dengan apa yang Anda baca?

    Berikan komentar, serta bagikan artikel ini ke social media.