Bahasa :
SWEWE Anggota :Login |Pendaftaran
Cari
Masyarakat ensiklopedia |Ensiklopedia Jawaban |Kirim pertanyaan |Pengetahuan kosakata |Upload pengetahuan
Sebelumnya 1 Berikutnya Pilih Halaman

Model Markov

Model Pendahuluan

Model Markov (Markov Model) adalah model statistik, banyak digunakan dalam pengenalan suara, pidato penjelasan otomatis, konversi kata audio, kemungkinan tata bahasa dan aplikasi pengolahan bahasa alami lainnya. Setelah pembangunan jangka panjang, terutama dalam keberhasilan penerapan pengenalan suara, membuatnya menjadi alat statistik umum.

Sejauh ini, telah dianggap sebagai cara yang paling berhasil untuk mencapai sistem pengenalan suara yang cepat dan akurat. Masalah yang kompleks melalui pengenalan suara Model Hidden Markov dapat dinyatakan sangat sederhana memecahkan, membiarkan orang 由衷地感叹 model matematis yang indah.Markov (1856 - 1922), ahli matematika Soviet. Chebyshev siswa. Dalam teori probabilitas, aspek teori bilangan, fungsi pendekatan teori dan persamaan diferensial, seperti yang sangat sukses.

Siapa Siapa

Markov adalah perwakilan sekolah matematika Petersburg. Untuk bekerja di nomor teori dan teori probabilitas aspek dikenal. Karya utamanya termasuk "probabilitas kalkulus" dan seterusnya. Dalam teori bilangan, ia mempelajari teori terus pecahan dan infinitive kuadrat, untuk memecahkan berbagai masalah. Dalam teori probabilitas, ia mengembangkan metode moment, memperluas ruang lingkup penerapan hukum bilangan besar dan teorema limit sentral. Markov adalah pekerjaan yang paling penting di tahun-tahun 1906-1912, diusulkan dan mempelajari metode analisis matematis dapat mempelajari proses-proses alami dalam skema umum - rantai Markov. Sekaligus menciptakan efek lanjutan dari proses non-acak - proses Markov. Markov diamati setelah tes berulang-ulang menemukan bahwa keadaan suatu transisi sistem negara selama konversi ke-n sering diperoleh sebelum keputusan sekali (pertama n-1 kali) hasil tes pada. Studi mendalam Markov menyatakan: Untuk sistem yang terdiri dari negara pergi ke negara lain dalam proses konversi, ada kemungkinan transisi dan kemungkinan pergeseran ini dapat didasarkan pada status mantan segera menyimpulkan, dan negara asli dari sistem dan proses Markov independen dari depan transfer. Teori rantai Markov dan metode telah banyak digunakan dalam ilmu alam, teknik dan utilitas publik.

Rantai Markov

[3] Yinandelie · Markov (Andrey Markov ,1856-1922) diberi nama, adalah proses stokastik waktu diskrit dengan Markov alam matematika. Proses ini, dalam kasus pengetahuan saat ini diberikan atau informasi di masa lalu (yaitu, status sejarah sebelumnya) untuk memprediksi masa depan (yaitu, periode setelah negara berikutnya) tidak relevan.

Markov waktu proses dan negara diskrit disebut rantai Markov, dilambangkan dengan Xn = X (n), n = 0,1,2 ...

Rantai Markov adalah variabel X1 acak, X2, X3 ... jumlah kolom. Kisaran variabel-variabel ini, yaitu himpunan semua nilai yang mungkin dari mereka, yang disebut "state space", dan nilai Xn adalah negara saat n. Jika Xn 1 untuk distribusi probabilitas bersyarat atas negara-negara Xn adalah fungsi hanya dari

P (Xn 1 = x | X0, X1, X2, ..., Xn) = P (Xn 1 = x | Xn)

Di mana x adalah sebuah negara dalam proses. Persamaan di atas dapat dianggap sebagai properti Markov konstan.

Markov pada tahun 1906 membuat prosedur yang pertama. Dan ini dapat digeneralisasi untuk jumlah yang tidak terbatas ruang negara yang diberikan oleh Kolmogorov pada tahun 1936.

Aplikasi

Terutama digunakan dalam pengenalan suara, audio dan konversi kata, POS tagging.

Bahasa alami adalah pertukaran manusia alat informasi. Banyak masalah pengolahan bahasa alami dapat setara dengan sistem komunikasi decoding masalah - seseorang berdasarkan informasi yang diterima, untuk menebak pemanggil coba katakan. Bahkan, ini adalah seperti komunikasi, orang-orang sesuai dengan sinyal yang diterima oleh penerima untuk menganalisis, memahami, untuk mengembalikan client mengirimkan informasi yang dikirim melalui. Sebagai contoh, sistem komunikasi yang khas: mana s1, s2, s3 ... menunjukkan sinyal yang dipancarkan oleh sumber informasi. o1, o2, o3 ... adalah penerima sinyal yang diterima. Komunikasi berdasarkan sinyal yang diterima diterjemahkan O1, O2, o3 ... mengembalikan sinyal s1 ditransmisikan, s2, s3 ....

Bahkan, orang-orang biasanya ketika mereka berbicara, otak adalah sumber informasi. Orang tenggorokan (vokal), udara, seperti kawat dan kabel seperti saluran. Telinga pendengar adalah akhir penerima, dan mendengar suara yang ditransmisikan dari sinyal. Menurut sinyal speaker akustik untuk berspekulasi, bahwa pengenalan suara. Jadi bisa dikatakan, jika akhir penerimaan adalah sebuah komputer dan bukan manusia, maka komputer harus dilakukan adalah pengenalan suara otomatis. Demikian pula, di komputer, jika kita ingin sesuai dengan informasi yang diterima dalam bahasa Inggris, menunjukkan bahwa arti Cina pembicara adalah terjemahan mesin; Jika kita ingin berspekulasi ingin mengungkapkan pembicara menurut pernyataan dengan kesalahan ejaan yang benar berarti bahwa secara otomatis benar salah. Jadi bagaimana menurut informasi yang diterima untuk berspekulasi bahwa pembicara ingin menyampaikan makna itu? Orang-orang dapat menggunakan apa yang disebut "hidden Markov Model" (HiddenMarkovModel) untuk memecahkan masalah ini. Dalam pengenalan suara, misalnya, ketika kita mengamati o1 sinyal suara, o2, o3, kalimat untuk menyimpulkan ditransmisikan s1, s2, s3 dari sinyal set. Jelas, kita harus menemukan yang paling mungkin salah satu dari semua kalimat yang mungkin. Bahasa matematika untuk menggambarkan berada di bawah o1 diketahui, o2, o3, ... kasus, menemukan kemungkinan kondisi seperti

P (s1, s2, s3, ... | o1, o2, o3 ....) mencapai nilai maksimum yang s1 kalimat, s2, s3, ...

Tentu saja, kemungkinan di atas tidak mudah untuk diperoleh secara langsung, sehingga orang tidak langsung dapat menghitungnya. Rumus Bayesian dan mengeluarkan istilah konstan, persamaan di atas dapat diubah menjadi setara

P (o1, o2, o3, ... | s1, s2, s3 ....) * P (s1, s2, s3, ...)

Antara

P (o1, o2, o3, ... | s1, s2, s3 ....) menunjukkan bahwa pernyataan s1, s2, s3 ... dibaca sebagai o1, o2, o3, ... kemungkinan dan

P (s1, s2, s3, ...) merupakan string s1, s2, s3, ... sendiri dapat menjadi kemungkinan yang masuk akal kalimat, arti dari rumus ini adalah sinyal s1 transmisi, s2, s3 ... dikalikan dengan jumlah kolom kemungkinan s1 ini, kemungkinan kalimat bisa s2, s3 ... itu sendiri, mengembalikan probabilitas.

(Pembaca baca di sini mungkin meminta Anda sekarang tidak masalah menjadi lebih rumit, karena rumus menulis lebih lama Jangan khawatir, kita menyederhanakan masalah.) Orang-orang lakukan di sini dua asumsi:

Pertama, s1, s2, s3, ... adalah rantai Markov, yaitu, si si-1 ditentukan oleh hanya (lihat Seri 1);

Kedua, sinyal yang diterima s i waktu oi ditentukan semata-mata oleh si sinyal transmisi (disebut juga output yang independen pada asumsi bahwa P (o1, o2, o3, ... | s1, s2, s3 ....) = P ( o1 | s1) * P (o2 | s2) * P (o3 | s3) ....

Lalu orang-orang dapat dengan mudah menemukan penggunaan maksimal dari rumus algoritma Viterbi di atas, dan kemudian menemukan kalimat harus diakui s1, s2, s3, ....

Model memenuhi dua asumsi ini disebut Hidden Markov Model. Kami menggunakan "tersembunyi" kata, karena s1 negara, s2, s3, ... tidak dapat diamati secara langsung.

Hidden Markov Model ini hanya diterapkan dalam pengenalan suara. Dalam rumus di atas, jika kita menempatkan s1, s2, s3, ... seperti Cina, o1 itu, o2, o3, ... sebagai bahasa Inggris yang sesuai, maka orang akan dapat menggunakan model ini untuk memecahkan masalah penerjemahan mesin; Jika kita The o1, o2, o3, ... sebagai fitur image untuk memindai teks untuk mendapatkan, kita bisa menggunakan model ini untuk memecahkan cetak dan pengenalan tulisan tangan.

P (o1, o2, o3, ... | s1, s2, s3 ....) tapi tergantung pada aplikasi nama yang berbeda dalam pengenalan suara disebut "model akustik" (AcousticModel), mesin Terjemahan adalah "model terjemahan" (TranslationModel) dan koreksi ejaan adalah "error correction model" (CorrectionModel). P (s1, s2, s3, ...) adalah model bahasa yang kita sebutkan dalam seri satu.


Sebelumnya 1 Berikutnya Pilih Halaman
Pemakai Ulasan
Belum ada komentar
Saya ingin komentar [Pengunjung (18.221.*.*) | Login ]

Bahasa :
| Periksa kode :


Cari

版权申明 | 隐私权政策 | Hak cipta @2018 Dunia pengetahuan ensiklopedis