Development and Objective Perceptual Quality Assessment of Monaural and Binaural Noise Reduction Schemes for Hearing Aids
Total Page:16
File Type:pdf, Size:1020Kb
Development and Objective Perceptual Quality Assessment of Monaural and Binaural Noise Reduction Schemes for Hearing Aids Von der Fakultät für Mathematik und Naturwissenschaften der Carl-von-Ossietzky-Universität Oldenburg zur Erlangung des Grades und Titels eines Doktors der Ingenieurwissenschaften (Dr.-Ing.) angenommene Dissertation Dipl.-Ing. Thomas Rohdenburg geboren am 28. Mai 1975 in Bremen Erstreferent: Prof. Dr. rer. nat. Dr. med. Birger Kollmeier Korreferenten: Prof. Dr.-Ing. Karl-Dirk Kammeyer PD Dr. rer. nat. Volker Hohmann Tag der Disputation: 17.12.2008 ii Abstract People with hearing impairment have great difficulties communicating in noisy and rever- berant environments. They usually require a higher signal-to-noise ratio (SNR) to achieve the same listening performance as normal hearing people. But even for normal hearing people a noise reduction is desirable in these environments, especially when using modern communication systems such as mobile phones, handsfree devices, or teleconferencing sys- tems. Hence, the development and evaluation of noise reduction algorithms is an active field of research. To achieve the maximum performance and subjective benefit, these al- gorithms generally need to be evaluated with objective measures that should be based on auditory models in order to predict human perception as closely as possible. The current dissertation contributes to this field by adding yet another dimension to the problem - binaural hearing (i.e., listening with two ears). As a starting point of this thesis, some frequently used objective performance measures and novel objective measures based on recent knowledge of the auditory system are re- viewed. Using subjective listening tests on signals processed by monaural noise reduction schemes, those measures are identified that exhibit the highest correlation with subjec- tive data. Using these measures, it is possible to optimize single-channel noise reduction algorithms on a perceptual scale. However, the performance of single-channel noise re- duction systems is limited and leads to a trade-off between signal distortion and noise reduction. Therefore, multi-channel beamformer algorithms are investigated throughout the main part of the thesis. In general, they introduce less signal distortions and achieve higher noise reduction for non-stationary signals. Typically, beamformers do not have binaural outputs. To provide the user with information on the spatial arrangement of signals, different strategies to partially preserve or reconstruct the binaural information are developed and evaluated with objective and subjective assessment data. For the ob- jective evaluation of the benefit on binaural speech perception, a novel binaural speech intelligibility measure is used and compared to subjective data. For the binaural beam- former schemes, the influence of head diffraction on the performance is analyzed. It is shown, that at least simple head-models should be integrated into the algorithm design to increase the performance compared to traditional free-field designs and to make use of the acoustic decoupling due to the head shadow effects. In order to utilize the algorithm iii under real-life conditions, the problem of moving target signals and head movements is tackled, that can reduce the effective benefit for the user of the microphone-array hearing aids. A self-steering beamformer is finally developed and evaluated under realistic rever- berant conditions, that exhibits increased performance compared to non-steered systems at positive signal-to-noise ratios. It is expected that both, the algorithms and objective assessment methods, will prove to be beneficial for human communication in noise in the future. iv Zusammenfassung Menschen mit einer Hörproblematik haben große Schwierigkeiten in lauten und widerhal- lenden Umgebungen zu kommunizieren. Gewöhnlich benötigen sie einen höheren Störpe- gelabstand als normal hörende Menschen, um dieselbe Hörleistung zu erzielen. Aber selbst für Normalhörende ist eine Störgeräuschreduktion in diesen Umgebungen erwünscht, be- sonders wenn moderne Kommunikationssysteme wie Handys, Freisprecheinrichtungen oder Telekonferenzanlagen verwendet werden. Daher ist die Entwicklung und Evaluation von Störgeräuschreduktionsalgorithmen ein aktives Forschungsfeld. Um den maximalen Nut- zen und subjektiven Gewinn zu erzielen, müssen diese Algorithmen im allgemeinen mit objektiven Maßen bewertet werden, die auf auditorischen Modellen basieren sollten, um die menschliche Wahrnehmung möglichst genau vorherzusagen. Die vorliegende Dissertation trägt zu diesem Forschungsfeld bei, indem sie dem Problem noch eine weitere Dimension hinzufügt - binaurales Hören (d.h., Hören mit zwei Ohren). Zum Einstieg dieser Doktorarbeit wird ein Überblick über einige häufig genutzte objektive Gütemaße und neuartige, auf aktuellen Kenntnissen des Auditorischen Systems beruhen- de, objektive Maße gegeben. Mit Hilfe von subjektiven Hörtests, mit den durch monau- rale Störgeräuschreduktion verarbeiteten Signalen, können die Maße mit der höchsten Übereinstimmung mit subjektiven Daten identifiziert werden. Mit Hilfe dieser Maße ist es dann möglich, einkanalige Störgeräuschreduktionsalgorithmen anhand einer perzepti- ven Bewertungsskala zu optimieren. Allerdings ist die Leistungsfähigkeit von einkanaligen Störgeräuschreduktionsalgorithmen begrenzt und führt auf einen Kompromiss zwischen Signalverzerrung und Störgeräuschreduktion. Daher wurden in dieser Arbeit hauptsäch- lich mehrkanalige Beamformer-Algorithmen untersucht. Im allgemeinen führen diese zu geringeren Signalverzerrungen und erzielen eine höhere Störgeräuschreduktion bei nicht- stationären Signalen. Normalerweise haben Beamformer keine binauralen Ausgänge. Um dem Benutzer die räumliche Information über die Signale darbieten zu können, werden ver- schiedene Strategien entwickelt und anhand subjektiver Bewertungen evaluiert, welche die binaurale Information teilweise erhalten oder rekonstruieren. Zur objektiven Evaluation des Gewinns an binauraler Sprachwahrnehmung, wird ein neuartiges binaurales Sprach- verständlichkeitsmaß verwendet und mit subjektiven Daten verglichen. Für die binauralen Beamformer wird der Einfluss der Beugung am Kopf auf die Leistungsfähigkeit analy- v siert. Es wird gezeigt, dass wenigstens einfache Kopfmodelle in den Algorithmenentwurf integriert werden sollten, um die Leistungsfähigkeit gegenüber traditionellen Freifeldent- würfen zu verbessern und die akustische Entkopplung aufgrund des Kopfschattens zu nutzen. Um den Algorithmus unter realen Bedingungen anwendbar zu machen, wird das Problem bewegter Nutzsignale und der Kopfbewegungen angegangen, welches den effekti- ven Gewinn für den Nutzer des Hörgeräte-Mikrofonarrays verringern kann. Ein sich selbst ausrichtender Beamformer wird schließlich entwickelt und unter realistischen widerhal- lenden Bedingungen evaluiert, der im Vergleich zu statischen Systemen eine verbesserte Leistungsfähigkeit bei positivem Störpegelabstand aufweist. Es ist zu erwarten, dass sich sowohl Algorithmen als auch objektive Bewertungsmethoden in der Zukunft als gewinn- bringend für die menschliche Kommunikation im Störgeräusch erweisen. vi Contents Abstract iii Zusammenfassung v Contents ix 1. Introduction 1 2. Development of a Toolbox for Objective Quality Assessment of Noise Reduction Schemes 5 2.1. Introduction .................................... 5 2.2. SNR Based Measures in Time and Frequency Domain ............ 6 2.2.1. Broadband Signal-to-Noise-Ratio .................... 6 2.2.2. Segmental SNR Measure ......................... 7 2.2.3. Frequency Weighted SNR ........................ 7 2.2.4. Signal-to-Noise Ratio Enhancement .................. 8 2.3. LPC Based Objective Measures ......................... 8 2.3.1. Log-Likelihood Ratio Measure ..................... 9 2.3.2. Itakura Saito Distortion ......................... 9 2.3.3. Log-Area-Ratio Measure ......................... 10 2.4. Perceptually Motivated Objective Measures .................. 10 2.4.1. Weighted Spectral Slope (WSS) Distance Measure .......... 10 2.4.2. PEMO-Q ................................. 11 2.4.3. PESQ ................................... 12 2.4.4. PEAQ ................................... 14 2.4.5. BSIM ................................... 14 2.5. Reference and Test Signal ............................ 15 2.6. Discussion ..................................... 15 3. Monaural Noise Reduction Schemes - Performance Evaluation and Optimization 17 3.1. Introduction .................................... 17 3.2. Comparison of Objective and Subjective Data for the Assessment of Single Channel Noise Reduction Algorithms .................. 18 3.2.1. Algorithms ................................ 18 3.2.2. Signals ................................... 18 3.2.3. Objective Measures ............................ 19 3.2.4. Experiments ............................... 20 vii Contents 3.2.5. Results .................................. 20 3.3. Subband-based Parameter Optimization in Noise Reduction Schemes by means of Objective Perceptual Quality Measures ............... 25 3.3.1. Algorithm ................................. 25 3.3.2. Perceptual Quality Measures ...................... 27 3.3.3. Parameter Optimization ......................... 27 3.3.4. Effects of the Noise Reduction on the Internal Representations . 28 3.4. Quality Assessment for Low-Power Applications ................ 30 3.4.1. Experiments and Results ........................ 31 3.5. Conclusion .................................... 32 4. Multi-Channel