Analýza a Zpracování Řečových a Biologických Signálů Sborník Prací 2009

ČESKÉ VYSOKÉ UÈENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Katedra teorie obvodù ANALÝZA A ZPRACOVÁNÍ ŘEČOVÝCH A BIOLOGICKÝCH SIGNÁLŮ SBORNÍK PRACÍ 2009 Editoøi sborníku Doc. Ing. Petr Pollák, CSc. Doc. Ing. Roman Èmejla, CSc. Prosinec 2009 ANALÝZA A ZPRACOVÁNÍ ŘEČOVÝCH A BIOLOGICKÝCH SIGNÁLŮ SBORNÍK PRACÍ 2009 Editoøi: Doc. Ing. Petr Pollák, CSc. Doc. Ing. Roman Èmejla, CSc. [email protected] [email protected] Katedra teorie obvodù http://amber.feld.cvut.cz vedoucí: Prof. Ing. Pavel Sovka, CSc. http://noel.feld.cvut.cz/speechlab - Laboratoø zpracování øeèi http://amber.feld.cvut.cz/bio - LaBiS - Laboratoø biologických signálù Foniatrická klinika 1.LF UK a VFN http://fonja.lf1.cuni.cz vedoucí: Doc. MUDr. Olga Dlouhá, CSc. Poděkování: Tato publikace vznikla za podpory grantu GAÈR 102/08/0707 „Rozpoznávání mluvené øeèi v reálných podmínkáchÿ, GAÈR 102/08/H008 „Analýza a modelování biomedicínských a øeèových signálůÿ a výzkumných záměrů MSM 210000012 „Transdisciplinární výzkum v oblasti biomedicínského inženýrstvíÿ a MSM 212300014 „Výzkum v oblasti informačních technologií a komunikacíÿ. Vydalo nakladatelství ÈVUT, Zikova 4, 166 36 Praha 6, v roce 2009. ISBN: 978-80-01-04474-2 Ediční poznámka Předložený sborník je souhrnem prací realizovaných doktorandy katedry teorie obvodù v oblasti číslicového zpracování signálù a aplikačním zaměřením na zpracování biomedi- cínských a øeèových signálù a navazuje na sborníky vydávané od roku 2005. Sborník dává pøehled o jednotlivých výzkumných aktivitách øe¹ených ve skupině zpraco- vání signálù na katedøe teorie obvodù. Prezentované příspěvky jsou shrnující a podrobnější informace o øe¹ených problémech lze nalézt v odkazovaných pramenech. V Praze 23. listopadu 2009 Doc. Ing. Petr Pollák, CSc. Doc. Ing. Roman Èmejla, CSc. editoøi sborníku Pøedmluva Tento díl sborníku prací studentù doktorského studia plynule pokraèuje v tradici katedry teorie obvodù, kdy studenti doktorského studia pravidelně prezentují výsledky své práce pøed svými kolegy i pedagogy na seminářích oznaèovaných jako "Pondělky”. Sborník, který držíte v ruce, obsahuje vybrané prezentace roku 2009 zaměrené na aplikaci metod číslicového zpracování signálù v oblastech zpracování øeèi a biologických signálù. Text proto poskytuje urèitou pøedstavu nejen o práci doktorandù, ale i o zaměření èásti vý- zkumu prováděného na katedøe. Semináøe a èasto kritické diskuse slouží dokorandùm i jejich ¹kolitelùm ke tříbení my¹lenek a nápadù. Přinášejí nové podněty pro zpracování disertačních prací. Vědecká práce na katedøe je podporována nejen institucionálními výzkumnými záměry, ale i úèelově financovanými projekty několika grantových agentur. V¹em poskytovatelùm podpory výzkumu chceme tímto sborníkem poděkovat. Zájemce o témata uvedená ve sborníku rádi přivítáme na na¹ich seminářích. Jejich pro- gram je pod názvem "Pondělky” uveden internetových stránkách http://amber.feld.cvut.cz/bio/ V Praze dne 25.11.2009 Prof. Ing. Pavel Sovka, CSc. vedoucí katedry Obsah Jan Barto¹ek: Prozodie, zjištění a využití základního tónu v rozpoznávání øeèi 1 Marek Bártù: Možnosti využití algoritmù nelineární aproximace pro parametrizaci øeèových signálù 9 Petr Bergl: Parametry zkoumající pravidelnost energie a znělosti øeèového signálu neplynulých promluv 16 Václav Bolom: Zvýrazňování øeèi v osobním automobilu 22 Tomá¹ Boøil: Grangerova kauzalita a EEG 30 Jaromír Doležal: BCI založený na manifestaci pohybové aktivity v EEG II 38 Jan Janda: Studie věkově závislých akustických parametrù v dětské øeèi 44 Robert Krejčí: Optimalizace výpočetně nároèné èásti rozpoznávaèe øeèi se zaměøe- ním na hardwarovou platformu OMAP 50 Ondøej Kuèera: Mechanické oscilace buněk 58 Martina Nejepsova: Multimediální slabikáø 62 Josef Rajnoha: Robustní rozpoznávání spojitých promluv kombinující metody po- tlaèování ¹umu a prùběžnou adaptaci akustických modelù na prostředí 70 Jan Rusz: Hodnocení rytmu v raném neléèeném stádiu Parkinsonovy nemoci 77 Adam Stráník: Návrh frameworku pro zpracování signálù v reálném èase v prostředí .NET 82 Barbora Vokáèová: Stimulace zpracování øeèových signálù u dětí s vývojovou dys- fázií pomocí arteterapeutických technik a strategií 90 Petr Zetocha: Zpřístupnění strukturované databáze dětských promluv 95 Jan Barto¹ek 1 Prozodie, zjiˇstˇen´ıa vyuˇzit´ızákladn´ıhotónu v rozpoznáván´ıˇreˇci Jan Bartoˇsek Ceskévysokéuˇcen´ıtechnickévˇ Praze, Fakulta elektrotechnická [email protected] Abstrakt: Pˇr´ıspˇevek pˇrináˇs´ıprvotn´ıpˇribl´ıˇzen´ıprácena rámcovémdisertaˇcn´ım tématu”Vyuˇzit´ıprozodie v rozpoznáván´ısouvisléˇreˇci”.Nejprve je definována prozodie jako informaˇcn´ıdoplnˇekkaˇzdéhotypu ˇreˇcia dálejsou pˇredstaveny hlavn´ı prozodickérysy a funkce ve smyslu lingvistiky (a zejménaˇceˇstiny). Následnˇeje diskutovánomoˇznévyuˇzit´ıprozodie ve strojovémrozpoznáván´ı souvisléˇreˇci.Dalˇs´ıkapitola se zabývámetodami pro detekci základn´ıfrek- vence (f0) ˇreˇcovéhosignálu,kteráje hlavn´ımnositelem intonaˇcn´ıinformace promluvy. Nakonec jsou zm´ınˇeny c´ıle prácejak krátkodobého,tak dlouho- dobéhocharakteru. 1. Uvod´ Rozpoznávaˇcesouvisléˇreˇcis neomezenou doménou(uˇzivatelova promluva m˚uˇzesestávat ze vˇsech slov danéhojazyka) zaloˇzenéna klasických pˇr´ıstupech (skrytéMarkovovy modely pro vyhodnocen´ıakusticképodobnosti s promluvou) dosahuj´ıv dneˇsn´ıdobˇepomyslného stropu v úspˇeˇsnostirozpoznán´ı.Tohoto stropu nemus´ıvˇsakbýtv˚ubec dosaˇzeno,pokud vstupn´ısignálnedosahuje odpov´ıdaj´ıc´ıch parametr˚u- napˇr.co do pomˇeruúrovn´ısignálu a ˇsumu. Jednou z moˇznost´ı, jak ale takovýpomyslnýstrop zvýˇsit,m˚uˇzebýtvyuˇzit´ı pˇr´ıdavných informac´ıv promluvˇe, se kterýmisouˇcasné“standardn´ı“rozpoznávaˇcenepra- cuj´ı.Takovýmipˇr´ıdavnýmiinformacemi mohou býtnapˇr´ıkladintonace (ˇcasovýpr˚ubˇehf0) promluvy ˇcipˇr´ızvuk.Obecnˇese tyto (a nˇekterédalˇs´ı,jak uvid´ımeposléze)jevy oznaˇcuj´ı jako prozodie. C´ılem tohoto pˇr´ıspˇevkuje pˇredstavit ˇctenáˇriprozodickérysy a funkce, kteréby mohly naj´ıtuplatnˇen´ıv reálných rozpoznávaˇc´ıch souvisléˇreˇci.To by mohlo vést napˇr´ıkladk inteligenci diktovac´ıhostroje, kterýby kromˇepˇrepisuˇreˇcn´ıkovy promluvy na text správnˇedoplˇnoval i interpunkˇcn´ıznaˇcky, ke kterýmby dospˇelz pr˚ubˇehu jeho intonace. Zároveˇnsi takédokáˇzemepˇredstavit ”rádce”rozpoznávaˇce,kterýby pro akusticky velmi podobnˇeznˇej´ıc´ıhypotézydokázalpˇriˇraditkaˇzdéz nich pravdˇepodobnost existence na základˇeprozodickéinformace, a tak navedl rozpoznávaˇcke správnému výsledku. 2. Prozodie Tato kapitola pˇrináˇs´ıv prvn´ıˇcástidefinici slova spolu s vytyˇcen´ımnázvoslov´ıprozodických rys˚ua funkc´ı.Hlavn´ımiprozodickýmifunkcemi se zabývádruháˇcásta moˇznévyuˇzit´ı prozodie v reálných ˇreˇcových technologi´ıch je diskutovánov ˇcástitˇret´ı. 2 Jan Barto¹ek 2.1. Co je to prozodie Slovo prozodie nese v souˇcasnédobˇedva r˚uzné,avˇsakne aˇztak nesouvislévýznamy. Prvn´ım významemje prozodie jako nauka o rytmiˇcnostiˇreˇcia skládán´ı verˇs˚u.Touto umˇeleckou oblast´ıse jiˇzdálezabývat nebudeme, za to se o to v´ıcepozastav´ıme u prozodie jako obecnéhovýrazupro informaˇcn´ıdoplnˇekkaˇzdéhotypu ˇreˇci.Svou prozodickou in- formaci opravdu nese kaˇzdáˇreˇc,tedy napˇr´ıkladi ˇreˇcznaková,kdy je prozodie vyjádˇrena mohutnost´ıgestikulace (vlastn´ıdefinovanágesta jsou jen jazykem, kterému kaˇzdýz gesti- kuluj´ıc´ıch dodápomoc´ıprosodie sv˚ujosobitýcharakter). Násovˇsembude zaj´ımatob- last lingvistiky, kde prozodie popisuje fonologicképˇr´ıznaky jazyka, kterése uplatˇnuj´ı úrovni vyˇsˇs´ıneˇzjednotlivýfoném(hláska, segment) a souhrnnˇese hovoˇr´ıo tzv. ”supraseg- mentáln´ıch jevech” (rysech prozodie). Zároveˇnje tˇreba rozliˇsovat mezi funkcemi prozodie (co zp˚usobuje,k ˇcemu je dobrá)a prozodickýmiformami (rysy - co ji tvoˇr´ı). Funkc´ıprozodie je tedy dávat posluchaˇciinformace, kterénejsou obsaˇzeny v pouhékom- binaci jazykových segment˚u.Prozodie tak m˚uˇzem˚uˇzeslouˇzitk: vyjádˇren´ıpostoje a momentáln´ıhoemotivn´ıhorozpoloˇzen´ımluvˇc´ıho • urˇcen´ı,jestli je promluva oznámen´ı,otázka ˇcipˇr´ıkaz • zd˚uraznˇen´ıˇcástipromluvy nebo významovýkontrast • urˇcen´ı,zda-li je mluvˇc´ıironickýˇcisarkastický • Dvˇeobecnˇedefinovanéfunkce prozodie jsou ”chunking” (nepˇrekládáno) a pˇr´ızvuk(focus). Obˇetyto prozodickéfunkce budou podrobnˇejirozvedeny dále. Prozodickéformy (rysy, elementy) jsou naopak stavebn´ımi kameny prozodie a jak jiˇz bylo uvedeno výˇse,souhrnnˇese hovoˇr´ıo tzv. ”suprasegmentáln´ıch jevech” odvozených z akustických charakteristik promluvy. Jednáse o tyto prvky: intonace (melodie) - výˇska základn´ıhotónu (f0, pitch) • frázován´ı,rytmus, mluvn´ıtempo • intenzita, hlasitost (ˇrevvs. ˇsepot, zvyˇsuj´ıc´ıse hlasitost, ...) • d˚uraz,pˇr´ızvuk(z anglického stress) • Terminologie je v tomto pˇr´ıpadˇepomˇernˇenejednotnáa to i v anglickémjazyce. Slova d˚uraz a pˇr´ızvuk v ˇceˇstinˇevýznamovˇesplývaj´ı,avˇsakv anglicky psanéliteratuˇrejsou ˇcasto odliˇsovány “stress” a “focus”. Pˇr´ızvukjako prozodickýrys zde splývás funkc´ızd˚uraznˇen´ı ˇcástipromluvy, je totiˇzbudovánna komplexu prozodických vlastnost´ıˇreˇcia realizován souˇcasnˇejak pomoc´ı zmˇendynamiky (tento jev oznaˇcmejako d˚urazovýpˇr´ızvuk), tak výˇskyhlasu (intonaˇcn´ı pˇr´ızvuk). Cetnostˇ pouˇz´ıván´ı obou typ˚upˇr´ızvuk˚use v r˚uzných jazyc´ıch liˇs´ı.Ani jeden z nich nemánapˇr.Kambodˇzˇstina,u vˇetˇsiny jazyk˚upˇrevládápˇr´ızvuk d˚urazový(plat´ıi pro ˇceˇstinu). Kromˇehlavn´ıhopˇr´ızvukuobvykle existuje

Load more