Sebelum mengetahui lebih lanjut tentang Speech Recognition, saya ingin membahas sedikit tentang Voice Recognition. Sesuai dengan arti katanya (voice = suara dan recognition = pengenalan) maka dapat kita katakan bahwa voice recognition adalah identifikasi atau pengenalan melalui suara. Voice recognition sendiri merupakan aplikasi dari Biometric Recognition (sistem pengenalan atau identifikasi seseorang berdasarkan karakteristik biologis khusus yang dimiliki oleh orang tersebut). Ada juga aplikasi biometric lainnya seperti retinal scan, fingerprint, dan face recognition. Voice recognition dibagi menjadi dua jenis, yaitu speech recognition dan speaker recognition. Bedanya, speech recognition adalah proses pengenalan kata yang diucapkan seseorang oleh computer (tidak terpaku pada jenis suara dan identitas orang tersebut), sedangkan speaker recognition adalah pengenalan identitas seseorang dari suaranya (misal intonasi, tingkat kedalaman suara, dan lain sebagainya). Jelas beda bukan?? Yang satu berdasarkan ‘kata’(speech) yang satu berdasarkan ‘pembicara’ (speaker).

Penggunaan Speech Recognition (AI)

Artificial intelegent (AI) atau yang lebih dikenal dengan istilah kecerdasan buatan adalah suatu bagian ilmu komputer yang mempelajari bagaimana membuat mesin (komputer) dapat melakukan pekerjaan seperti dan sebaik yang dilakukan oleh manusia bahkan bisa lebih baik daripada yang dilakukan manusia.

Pengenalan ucapan (speech recognition)
manusia dapat berkomunikasi dengan komputer menggunakan suara. Hal ini sangat berbeda dengan Pengolahan bahasa alami (natural language processing) yang menerima pesan suara secara umum , Pengenalan ucapan (speech recognition) dapat membedakan antara suara manusia yang satu dengan suara manusia lainnya. Dalam kehidupan sehari-hari Pengenalan ucapan (speech recognition) telah banyak sekali implementasinya contohnya hak akses seseorang kedalam suatu ruangan tertentu dimana orang yang ingin masuk, harus memberikan sandi suara terlebih dahulu. Hal yang tidak mungkin untuk masa yang akan datang teknologi ini akan dimanfaatkan hampir keseluruh objek yang memerlukan Pengenalan ucapan/suara, misal dapat diterapkan ke mobil ferari kesayangan dimana untuk mengendarainya kita harus memberikan akses suara terlebih dahulu, hal ini pasti akan membuat seorang pencuri akan berpikir berkali-kali sebelum mencuri mobil tersebut.

Speech Recognition Software merupakan proses identifikasi suara berdasarkan kata yang diucapkan.

Dalam menggunakan Speech Recognition Software kita dapat :

a. Belajar cara berbicara dengan komputer dengan tutorial yang akan mengajarkan
penggunaan perintah-perintah dengan Speech Recognition.
b. Melatih komputer untuk memahami suara yang diinputkan. Speech Recognition
menggunakan sebuah profil unik suara untuk mengenali suara dan perintah. Semakin
sering dan banyak menggunakan Speech Recognition, maka akan semakin detil profil
karakter suara seseorang, hal ini akan meningkatkan kemampuan komputer untuk
memahami suara seseorang.

Dengan menggunakan Speech Recognition Software dapat diperoleh manfaat sebagai berikut :

* Mengajukan Pertanyaan
Temukan cara untuk melakukan tugas pada PC dengan bertanya “How do I”. Contohnya
jika seorang pengguna ingin mengetahui cara merubah tema desktop, pengguna cukup
menanyakan “How do I change my desktop theme?”

Kemudian komputer akan merespon sesuai perintah dan akan menuntun pengguna tentang cara mengganti tema desktop.

1. Memeperbaiki kata yang tidak dikenal
Jika Speech Recognition tidak mengenali suatu perintah, maka pengguna dapat
kata-kata yang tidak dikenali tersebut dengan memilih alternatif yang telah
disediakan atau dengan mengeja kata tersebut.
2. Menggunakan Perintah untuk Mendiktekan
Mengalamatkan email dan dokumen, membuat perbaikan, dan menyimpan peker
jaan dengan memerintahkan komputer untuk mendiktekan.
3. Memperhatikan Cara Program Beradaptasi dengan Pengguna
Setiap individu mempunyai suara dan intonasi yang unik, Speech Recognition
mempelajari cara mengatur seluk-beluk nada perintah. Software lunak
mempelajari perintah-perintah yang biasanya digunakan oleh pengguna dan
meningkatkan interaksi perintah tersebut dengan komputer.

Kesulitan yang dialami dalam menggunakan Speech Recognition Software yaitu :

1. Pengucapan kalimat atau kata dalam bahasa inggris harus benar.
2. Suara harus keras dan jelas.
3. Pelafalan juga harus jelas.
4. Bila suara tidak jelas maka perintah yang dijalankan komputer tidak
benar/salah.
5. Begitu juga dengan pengucapannya jika salah dan tidak jelas, komputer tidak
melaksanakan instruksi yang diberikan.
Intonasi dilakukan secara pelan, namun harus benar.

Speech recognition ditujukan untuk memenuhi kebutuhan informasi pekerja, terutama bagi mereka yang tugas utamanya menggunakan aplikasi email, aplikasi pengolah kata, dan web browser.

Sumber :

http://www.informatika.org/~rinaldi/Stmik/2007-2008/Makalah2008/MakalahIF2251-2008-077.pdf

http://en.wikipedia.org/wiki/Speech_recognition