Spraak-in-ruis?

advertisement
Eigenschappen Normaal Gehoor
AUDTUTOR
Spraakverstaan-in-Ruis
bovendrempelige effecten
van gehoorverlies
Arjan J Bosman
- AudTutor Radboudumc
• hoge gevoeligheid
• groot dynamisch bereik
• gedetailleerde geluidanalyse
• discriminatie en geluidherkenning
• selectie voorgrond - achtergrond
• onderdrukking stoorgeluid (‘maskering’)
• bronselectie
• lokalisatie, richtinghoren
Karakterisering gehoor
Hoezo nieuw: Spraak-in-ruis?
• dynamiek
• toondrempel en drempel onaangename luidheid
• discriminatie
• spraakaudiometrie (NVA-monosyllaben)
• selectie voorgrond – achtergrond
• spraak-in-ruis
• bronselectie - richtinghoren
• horizontale vlak: azimuth
• verticale vlak: elevatie
Detectie en Verstaan van spraak als
functie van ruisniveau
Continuous discourse
‘The Wealth of Nations’
(Adam Smith)
Spraakverstaan als functie van ruisniveau
Twee asymptoten:
stilte - horizontaal
ruis - diagonaal (450)
Hawkins en Stevens
(1950)
1
Spraakverstaan in stilte en in rumoer
Onderscheid stilte en rumoer
Twee onafhankelijke aspecten
• Verstaan in stilte
• horizontale asymptoot
• ‘interne’ ruis
verlies in
rumoer
• Verstaan in rumoer
• diagonale asymptoot: lijn onder 450
• 1 dB toename ruisniveau ↔ 1 dB toename spraakdrempel
• constante signaal-ruisverhouding
verlies
in stilte
normcurve
Model Spraakverstaan - Plomp
Model Spraakverstaan -2-
Rumoer (‘ruis’)
• verstaan gedomineerd door signaal-ruisverhouding (S/R ratio)
• S/R constant bij voldoende ruis
• toename (‘ongunstiger’) S/R ratio bij gehoorverlies
• bovendrempelig deficit: ‘vervorming’
• Rumoer
• vervorming
• ‘distortion’ → D-term
Stilte
• verstaan bepaald door gevoeligheid van het gehoor
• forse toename spraakdrempel met gehoorverlies
• ‘verzwakking’ én ‘vervorming’
Model Spraakverstaan -3-
D = 8 dB
• Stilte
• verzwakking en vervorming
• ‘attenuation and distortion’ → A+D-term
• Combinatie van beide factoren:
SRT = 10 x 10 log (10 (SRTq
+ A+D)/10
+ 10 (Ln + SRTn + D)/10)
Grotere gehoorverliezen …
Normaalwaarden
Ruis hoorbaar?
SRTq = 16 dBA
effect ruisniveau
SRTn = -5 dB S/R
50 dB: ‘stilte’
60 dB: ‘ruis’?
70 dB: ‘ruis’
A+D = 29 dB
2
Speech Reception Threshold (SRT)
Plomp en Mimpen zinnen
Speech Reception Threshold (SRT) c.q. spraakdrempel in ruis
• verhouding van spraak en (maskeer)ruis waarbij de spraak nog
juist wordt verstaan
• Nederlandse ‘gouden standaard’
• score varieert sterk als functie van ruisniveau
• helling rond 50%-punt: 15%/dB
• zeer geschikt voor adaptieve meting
• buitenlandse navolging: HINT test (USA, 1994)
• SRT-meting
• 50 % spraakverstaan
• maskering door continue of fluctuerende ruis
• spraak en ruis uit dezelfde richting of ruimtelijk gescheiden
• adaptieve procedure (bij een steile scorecurve)
• Spraakmateriaal
• alledaagse zinnen van 8 à 9 syllaben (Plomp en Mimpen)
• synthetische zinnen (Matrix test)
• getallen (tripletten)
• nadelen c.q. kritiek
• slechts 2 * 10 lijsten van 13 zinnen (man/vrouw)
• zinnen worden onthouden ↔ herhaald aanbieden zinloos
• gebruik beperkt tot Audiologische Centra
• sommige zinnen zijn gedateerd
• Niek Versfeld (2000)
• VU-zinnen: 39 lijsten van 13 zinnen
Zinsverstaan in rumoer
Zinsverstaan in rumoer: Matrix-test
• eenvoudige alledaagse zinnen - Plomp en Mimpen (1979)
• 8 en 9 lettergrepen
• herhaal aangeboden zin
• compleet correct herhaalde zinnen
• vijf-woord zinnen met vaste syntactische structuur
• 1. naam
• 2. werkwoord
• 3. aantal
• 4. bijvoeglijk naamwoord
• 5. zelfstandig naamwoord
• maskeerruis
• stationair of fluctuerend
• zelfde spectrum als de spreker
• per woord 10 alternatieven
• adaptieve meting
• correcte herhaling: verlaag niveau spraak
• incorrecte herhaling: verhoog niveau spraak
• adaptieve verandering niveau
• op basis woordscore én volgorde aanbieding
Demonstratie: Matrix test
Matrix test -2-
• in meerdere talen beschikbaar: NL, UK, D, F, Fin, …
• Voordelen
• internationale standaardisatie ≈ taalonafhankelijk
• ‘onbeperkt’ aantal zinnen
• minimale gokkans ↔ 10 alternatieven per stimuluswoord
• gesloten responsieformaat mogelijk
• geschikt voor (fundamenteel) onderzoek
• Nadelen c.q. kritiek
• leereffect – minstens twee oefenlijsten nodig
• gesloten responsieformaat kost (te) veel tijd
• semantisch incorrecte zinnen ↔ gebruik redundantie
• test op zinsniveau of woordniveau?
3
Demonstratie: cijfers in rumoer
Cijfers-in-Rumoer
Spraakverstaan-in-rumoer
• steile scorecurve → vloer- en plafondeffect
• adaptieve meting
• Voordelen
• eenvoudige test ↔ weinig instructie nodig
• gering leereffect
• snel uit te voeren
• cijfers: 0..9
• ruis met hetzelfde spectrum als spreker
• tripletten ter verkleining gokkans
• Score
• drie getallen correct: goed, anders: fout
• Nadelen c.q. kritiek
• klinkereffect: 0, 1/2, 3/4, 5, 6, 7/9, 8
• monosyllaben en bisyllaben (zeven, negen)
• discriminatietest
• Adaptieve meting: ‘1-op, 1-neer’
• goed: volgend drietal 2 dB zachter
• fout : volgend drietal 2 dB harder
Energetische Maskering - Voorbeeld
Informationele Maskering (IM)
stationaire ruis vs fluctuerende ruis
energetische, neutrale (EM) vs informationele maskeerder (IM)
• perifeer vs (meer) centraal proces
• ‘luisteren in de gaten (van de maskeerder)’
• ‘dip listening’
• stationaire ruis
• fluctuerende ruis
• EM van spraak afhankelijk van
• fysische eigenschappen maskeerder (spectrum, fluctuaties)
• IM van spraak afhankelijk van
• maskeerder: spraak vs non-spraak
• gelijkenis doel (spraak) en maskeerder
• spectraal, temporeel, harmonische structuur (f0)
• karakter van maskeerder
• aantal sprekers; ‘dip listening’ → energetisch effect
• maskeerder met wel/geen tijdomkering
Horen met Twee Oren
Ruimtelijke Maskering
binauraal (‘stereo’) horen
• Intelligibility Level Difference
• Spraak frontaal en maskeerder frontaal (S0N0)
• Spraak frontaal en maskeerder op 900 azimuth (S0N90)
• verschil in looptijd
• Interaural Timing Difference (ITD)
• verschil in intensiteit
• Interaural Level Difference (ILD)
• lokalisatie
• richtinghoren
• onderscheid ruimtelijk gescheiden bronnen
• Head shadow (‘hoofdschaduw’)
• Spraak frontaal en maskeerder op +/- 900 (S0N+90) en (S0N-90)
• selectief gebruik oor met beste signaal-ruisverhouding
• Binaural Intelligibility Level Difference (‘cocktailparty effect’)
• Spraak frontaal en maskeerder op 900 (S0N90)
• demaskering door inzet tweede oor
4
Ruimtelijke Maskering - ILD
Ruimtelijke Maskering - BILD
1. Spraak frontaal en maskeerder frontaal (S0N0)
2. Spraak frontaal en maskeerder op 900 azimuth (S0N90)
• Spraak frontaal en maskeerder op 900 (S0N90)
• demaskering bij gebruik tweede oor
Spraak
Ruis
Spraak
Spraak
Ruis
Spraak
Ruis
Ruis
ILD ≈ 10 dB (Plomp, 1986; Kollmeier et al, 2007)
BILD ≈ 3 dB (Kollmeier et al., 2007)
Ruimtelijke Maskering - Hoofdschaduw
CROS of Baha bij éénzijdige doofheid
Spraak frontaal en maskeerder op +/- 900 (S0N+90) en (S0N-90)
• eenzijdig gehoorverlies
Zinnen
Plomp &
Mimpen
(1979)
Ruis
Spraak
Spraak
Spraak
Ruis
Spraak
stilte
ruis 65 dBA
Ruis
Minder Horende
Zijde
Hoofdschaduw-effect ≈ 4 dB (Hol et al., 2005)
Spraak Lateraal – Ruis Frontaal
Ruis
Beter Horende
Zijde
Maskering - overzicht (Plomp, 1986)
Ruis
Spraak
Spraak
10 dB
7 dB
reversed speech
5
Woord/Zin, Stilte/Ruis meten?
Audiometrie - YNH en NIHL
YNH
Young Normal Hearing
D-factor
NIHL
Noise-Induced Hearing Loss
A+D-factor
Plomp (1986)
Audiometrie - OHI en MEN
Zinsverstaan in stilte vs PTA0.5,1,2
OHI
Old Hearing Impaired
(Presbyacusis)
MEN
Menière’s disease
Bosman en
Smoorenburg (1995)
Zinsverstaan vs CVC-Foneemverstaan
Zinsverstaan in rumoer
20 dB
p>5%
NH
NH
Bosman en
Smoorenburg (1995)
Bosman en
Smoorenburg (1995)
6
Zinsverstaan in stilte vs ruis
Wat te meten?
• Geringe correlatie tussen A+D en D-term
• spraak in stilte slechte voorspeller voor spraak in ruis!
• spraak-in-stilte
• woordenlijst: spraakdrempel én maximale discriminatie
p>5%
Bosman en
Smoorenburg (1995)
• spraak-in-rumoer
• mits maximale discriminatie > 60%
• zinnenlijst of gevalideerd alternatief (tripletten, DIN-test)
• spraakdrempel (S/R verhouding)
• onderscheid SH vs NH groter met gescheiden bronnen en
fluctuerende ruis.
N.B. relevantie meetresultaten voor de dagelijkse praktijk (?!)
Ruisreductie -1-
Ruisreductie -2-
• monauraal
• richtinggevoelige microfoons
• onderdrukking windruis
• ruisschatting: spectrale of temporele modulaties
• verminder versterking van ruis gedomineerde banden
• spectrale subtractie: signaal -/- geschat ruisspectrum
• spectrale subtractie
• schat ruisspectrum: selecteer fragment met alleen ruis
• verminder totale signaal met geschat ruisspectrum
• binauraal
• combinatie linker en rechter signaal
• grotere richtinggevoeligheid
• selectie polair patroon per zijde
• prefereer zijde met beste signaal-ruisverhouding
Selecteer (ruis-)fragment
Ruisspectrum
Demo: Rumoer in vliegtuigcabine
Origineel: laag-frequente energie domineert
Ruisreductie
Demo: Spraak in Rumoer
Spraak vrijwel volledig gemaskeerd door rumoer
7
Demo: Effect ruisreductie
Conclusies ruisonderdrukking
• digitale algoritmen leiden (meestal) niet tot een significante
verbetering van het spraakverstaan in rumoer
• effect afhankelijk van het aantal kanalen
• het luistercomfort neemt vaak wel toe ↔ luisterinspanning
• alle algoritmen falen wanneer de ruis (het stoorgeluid) ook uit
spraak bestaat
‘De Noordenwind en de Zon. De Noordenwind en de Zon waren
erover aan het redetwisten wie van hun beiden de sterkste was.’
Conclusies
Aanbevelingen
• Het normale gehoor
• groot dynamisch bereik
• gedetailleerde geluidsanalyse
bij klachten over verstaan in rumoer
• Belangrijkste eigenschappen
• scheiding voor-/achtergrond - selectieve attentie
• Gehoorverlies
• 1. verlies aan detail
• ‘ik hoor het wel, maar versta het niet’
• spraakdiscriminatie en spraakverstaan in rumoer
• 2. verlies gevoeligheid
• ‘hard horend’
• spraakdrempel in stilte
• meet spraakverstaan in ruis
• eenvoudigste optie: NVA woordenlijst en NVA-ruis
• gescheiden bronnen
• alternatief: cijfers-in-ruis
• de nationale hoortest: www.hoortest.nl
8
Download