پاورپوینت بازشناسی گفتار (Speech Recognition)

پاورپوینت بازشناسی گفتار (Speech Recognition)

پاورپوینت بازشناسی گفتار (Speech Recognition)

پاورپوینت بازشناسی گفتار (Speech Recognition)

دسته بندی پاورپوینت
فرمت فایل ppt
حجم فایل 482 کیلو بایت
تعداد صفحات 28
برای دانلود فایل روی دکمه زیر کلیک کنید
دریافت فایل

نوع فایل: پاورپوینت (قابل ویرایش)

قسمتی از متن پاورپوینت :

تعداد اسلاید : 28 صفحه

Speech Recognition In the name of God بازشناسی گفتار (Speech Recognition) بازشناسی گفتار (Speech Recognition) تشخیص گفتار انسان توسط ماشین و تبدیل آن به متن یا دستورالعمل معادل

نكات مطرح در بازشناسی گفتار
تعداد كلمات مورد بازشناسی
پیوسته یا گسسته بودن ادای كلمات
وابستگی یا استقلال از گوینده
بازشناسی گفتار یک سیستم بازشناسی کامل :
قادر به بازشناسی گفتار پیوسته و محاوره‌ای باشد.
گفتار افراد مختلف، حتی با لهجه‌های متفاوت را بازشناسی نماید.
در محیط‌های شلوغ و نویزی هم جوابگو باشد.
بصورت بلادرنگ عمل کند.
قادر به فراگیری اطلاعات جدید نظیر کلمات، قوانین زبانی و . . . باشد.

سیستم‌‌های کاربردی امروزی:
گفتار بایستی به صورت کتابی باشد.
گفتار بایستی بر اساس حالت استاندارد زبان باشد و تغییرات مربوط به لهجه‌ها منجر به کاهش کارایی می‌شود.
استفاده از آنها در محیط و شرایط نویزی منجر به افت کارایی و دقت آنها می‌شود.
اغلب سیستم های کاربردی امروزی تقریبا بلادرنگ هستند.
سیستم‌های موجود محدود به کلمات موجود در واژگان هستند و از اطلاعات زبانی و معنایی به صورت محدود استفاده می‌کنند. بازشناسی گفتار انواع سیستم های بازشناسی گفتار بر اساس تعداد كلمات
واژگان کوچک(Small Vocabulary): 1 تا 100 کلمه
واژگان متوسط (Medium Vocabulary): بین 100 تا 1000 کلمه
واژگان بزرگ (Large Vocabulary) : بین 1000 تا 60000 کلمه
واژگان خیلی بزرگ (Very Large Vocabulary): بیشتر از 60000 کلمه

انواع سیستم های بازشناسی گفتار بر اساس وابستگی یا استقلال از گوینده
وابسته به گوینده (SD: Speaker Dependent): به یک و یا چند گوینده‌ خاص پاسخ می‌دهد.
مستقل از گوینده (SI: Speaker Independent) به تمام گویندگان یک زبان پاسخ می‌دهد. بازشناسی گفتار انواع بازشناسی گفتار بر اساس پیوسته یا گسسته بودن كلمات
بازشناسی کلمات مجزا (IWR: Isolated Word Recognition)
گفتار کلمه به کلمه و کاملاً مجزا – هر فایل صوتی یک کلمه
بازشناسی گفتار متصل (Connected Word Recognition)
دنباله‌ای از کلمات که به وسیلة سکوتی کوتاه از هم جدا شوند – هر فایل شامل چند کلمه با سکوت در بین کلمات
بازشناسی گفتار پیوسته کتابی (CSR: Continuous Speech Recognition)
گفتار به صورت دیکته کتابی و روان
بازشناسی گفتار پیوسته محاوره ای (Spontaneous Speech Recognition)
گفتار به صورت کاملاً طبیعی بیان میشود، شامل جملات ناقص، سرفه، تپق، مکث‌های طولانی و … است. بازشناسی گفتار: واحد آوایی واحد آوایی: واحدی از زبان كه در بازشناسی گفتار مورد مدلسازی قرار می گیرد مانند كلمه (word)، واج (phoneme)، هجا (syllable)، واحدهای وابسته به بافت (context dependent) و …

در بازشناسی گفتار برای هر واحد آوایی یك مدل (آوایی) آكوستیك تشكیل می شود.

واحد آوایی بسته به نوع بازشناسی گفتار (پیوسته یا گسسته، با واژگان كوچك یا بزرگ) انتخاب می گردد.
واحد آوایی برای بازشناسی گفتار با واژگان كوچك معمولاً كلمه است.
برای بازشناسی گفتار پیوسته با واژگان بزرگ معمولاً واج ها به عنوان واحد آوایی انتخاب می گردند. بازشناسی گفتار بازشناسی گفتار با رویکرد تشخیص الگو
با فرض داشتن دنباله آكوستیك A، دنباله كلمات W را طوری پیدا كنید كه P(W|A) ماكزیمم شود.

با استفاده از قانون بیز:

P(A|W): احتمال مشاهده دنباله آكوستیك A به شرط مشاهده دنباله كلمات W ← با استفاده از مدل آوایی (آكوستیك) محاسبه می شود.

P(W): احتمال رخداد دنباله كلمات W در زبان ← با استفاده از مدل زبانی به دست می آید. بازشناسی گفتار بازشناسی گفتار دارای دو فاز آموزش (Train) و آزمون (Test) می باشد.
آموزش: مدل های آكوستیك و زبانی با استفاده از داده های آموزشی تشكیل می شوند.


توجه: متن بالا فقط قسمت کوچکی از محتوای فایل پاورپوینت بوده و بدون ظاهر گرافیکی می باشد و پس از دانلود، فایل کامل آنرا با تمامی اسلایدهای آن دریافت می کنید.