پیاده‌سازی سیستم‌های ترکیبی حذف انعکاس از گفتار و ارائه دادگان دوکاناله گفتار فارسی برای سنجش کارآیی آنها

نوع مقاله: مقاله پژوهشی

نویسندگان

1 استادیار/دانشگاه آزاد اسلامی واحد نجف آباد

2 دانشیار/دانشگاه یزد

چکیده

در این مقاله جوانب مختلف مسأله حذف انعکاس از سیگنال گفتارفارسی بررسی می‌شود. به عنوان مصالحه‌ای بین میزان بهسازی گفتار از یکسو و پیچیدگی و بار محاسباتی روش از سوی دیگر، تعداد دو میکروفون در سیستم در نظر گرفته شده است. به منظور امکان سنجش و مقایسه کارآیی سیستم‌های مورد نظر، ابتدا مجموعه لغات فارسی برای آزمون قابلیت فهم گفتار تهیه و سپس با استفاده از آن، دادگان دو کاناله گفتار فارسیِ دارای انعکاس طراحی و ضبط گردید. در این تحقیق، روش‌های پایه (تک‌کاناله و دوکاناله) حذف انعکاس از گفتار مطالعه و پیاده سازی و با استفاده از دادگان تهیه شده مقایسه گردیده‌اند. بر پایه این مطالعه، یک سری از روش‌های ترکیبی که قابلیت فهم و کیفیت سیگنال گفتار آغشته به انعکاس را به نحو مطلوبی افزایش می‌دهد، ارائه شده‌است و نشان داده شده است که ترکیب سه روش delay-and-sum beamforing، فیلتر معکوس، و روش مبتنی بر خطای فاز نسبت به سایر سیستم‌های ترکیبی از لحاظ میزان کیفیت و قابلیت فهم گفتار خروجی منجر به نتایج بهتری می‌شود.

کلیدواژه‌ها


عنوان مقاله [English]

Implementation of Hybrid Speech Dereverberation Systems and Proposing Dual Microphone Farsi Database in Order to Evaluating Enhancement Systems

نویسندگان [English]

  • Farhad Faghani 1
  • Hamid Reza Abutalebi 2
1 Assistant Professor/Najafabad Branch, Islamic Azad University
2 Associate Professor/Yazd University
چکیده [English]

In various applications, such as speech recognition and automatic teleconferencing, the recorded speech signals may be corrupted by both noise and reverberation. Reverberation causes a noticeable change in speech intelligibility and quality. In this research, firstly reverberation is described. There are some de-reverberation enhancement algorithms that use only one microphone. They mostly use inverse filtering and spectral subtraction as their sub-systems. On the other hand, there are many multi-microphone speech enhancement systems; Delay-and-sum beam former is the most famous amongst them. Moreover, several efficient approaches have been also reported that use linear prediction (LP) residual signal, inverse filtering, and phase error.
Despite the improvements and benefits gained by the use of several input microphones, considering the tradeoff between these gains and the complexity and computational cost forced by the use of more microphones, many researchers have focused on dual-microphones systems. So, a review on Microphone array signal processing is explained and then an arrangement for two microphones systems is proposed.
As we want to evaluate these algorithms for Farsi speech signals, the problem of speech intelligibility assessment has been explained and a Farsi word list for Diagnostic Rhyme Test (DRT) is presented.The structure of presented word list is similar to that of English DRT words. In this research, after a brief study of above-mentioned methods, we propose and implement some hybrid techniques to benefit from the advantages of several methods and achieve significant improvement in output signals. It will be shown that the proposed method performs superior to the state-of-the-art dereverberation algorithms.

کلیدواژه‌ها [English]

  • Speech enhancement
  • dereverberation
  • reverberant speech enhancement
  • Farsi speech database
  • DRT