کدگذاری سیگنال صحبت تحت محیط‌های نویزی مبتنی بر مدل سیستم شنوایی انسان

نوع مقاله: مقاله پژوهشی

نویسندگان

1 مربی/دانشگاه آزاد اسلامی واحد میمه

2 استادیار/دانشگاه صنعتی اصفهان

3 دانشیار/دانشگاه صنعتی اصفهان

چکیده

در این مقاله یک سیستم آنالیز/ سنتز، بر اساس مدل طبیعی حلزونی گوش و ویژگی‌های درک شنوایی انسان ارائه شده که قادر به کد کردن سیگنال گفتار در شرایط دشوار آکوستیکی است. بدین منظور، سیگنال نویزی توسط یک بانک فیلترگاماتن مختلط به تعدادی زیرباند شنوایی تجزیه شده و سیگنالِ هر زیرباند به طور مستقل و وفقی، از جهت حذف نویز پردازش می‌شود. استخراج پارامترها و فشرده‌سازی نیز از طریق ماسک گذاری کوتاه مدت، یک روش کوانتیزاسیون غیریکنواخت جدید و الگوریتم‌های کدینگ بدون تلفات صورت می‌گیرد. ارزیابی کیفیت از طریق آزمون‌های استاندارد کمی و کیفی، نشان می‌دهد که علیرغم کاهش قابل توجه نرخ بیت تا حدودKbps  14.6، کیفیت سیگنال‌های سنتزشده بهبود معناداری یافته، و عملکرد سیستم در برابر انواع نویزهای سفید، رنگی و پریودیک، باثبات و مؤثر است. همچنین کیفیت سیگنال‌های خروجی در مقایسه با نتایج چند نمونه کدینگ استاندارد، قابل رقابت ارزیابی شده است.

کلیدواژه‌ها


عنوان مقاله [English]

Speech Coding in Noisy Environments based on Human Auditory System Model

نویسندگان [English]

  • Seyed Iman Abtahi 1
  • Mohammad Reza Ashouri 2
  • Rassol Amir Fattahi 3
1 Instructor/Islamic Azad University, Meymeh
2 Assistant Professor/Isfahan University of Technology
3 Associated Professor/Isfahan University of Technology
چکیده [English]

In this paper, an analysis/synthesis system based on the natural Cochlear model and the human auditory perception properties is presented that is capable of coding the speech signal under harsh acoustic conditions. For this purpose, the corrupted signal is decomposed into a number of sub-bands using complex Gammatone filter bank, and the sub-band signals are individually and adaptively denoised. Temporal masking, a combination of a novel non-uniform quantization method and lossless coding algorithms are then applied to reduce the number of coefficients and compression. The proposed system is very robust and effective in dealing with different kinds of noises such as white, colored and periodic noises. Objective and Subjective quality measurements demonstrate significant improvement in the perceptual quality of synthesized speech while considerable reduction in bit-rate to approximately 14.6 Kbps is achieved.

کلیدواژه‌ها [English]

  • Natural Cochlear model
  • auditory perception properties
  • complex Gammatone filter bank
  • lossless coding algorithms
  • objective and subjective quality measures