b TOC o 1-3 h z u HYPERLINK l _Toc523139545 Capitolul 1. Motivatie PAGEREF _Toc523139545 h 1 HYPERLINK l _Toc523139546 1.1 Electroencefalografia PAGEREF _Toc523139546 h 1 HYPERLINK l _Toc523139547 1.1.1 Comparatii cu alte tehnici de imagistica PAGEREF _Toc523139547 h 1 HYPERLINK l _Toc523139548 1.1.2 Benzi de frecventa PAGEREF _Toc523139548 h 2 HYPERLINK l _Toc523139549 1.2 Provocari Tehnice PAGEREF _Toc523139549 h 3 HYPERLINK l _Toc523139550 1.3 Contributii PAGEREF _Toc523139550 h 4 HYPERLINK l _Toc523139551 2. Background Tehnic PAGEREF _Toc523139551 h 5 HYPERLINK l _Toc523139552 2.1 Modele Matematice PAGEREF _Toc523139552 h 5 HYPERLINK l _Toc523139553 2.1.1 Frecventa-timp PAGEREF _Toc523139553 h 5 HYPERLINK l _Toc523139554 2.1.2 Teoria Informatiei PAGEREF _Toc523139554 h 6 HYPERLINK l _Toc523139555 2.1.3 Modele Parametrice PAGEREF _Toc523139555 h 7 HYPERLINK l _Toc523139556 2.2 Background pentru machine learning PAGEREF _Toc523139556 h 7 HYPERLINK l _Toc523139557 2.2.1 Metode de extragere a trasaturilor PAGEREF _Toc523139557 h 8 HYPERLINK l _Toc523139558 2.2.2 Clasificari PAGEREF _Toc523139558 h 11 HYPERLINK l _Toc523139559 2.2.3 Problema supra-antrenarii PAGEREF _Toc523139559 h 15 HYPERLINK l _Toc523139560 2.3 Acuratetea masuratorilor PAGEREF _Toc523139560 h 16 HYPERLINK l _Toc523139561 2.3.1 Metode de re-esantionare PAGEREF _Toc523139561 h 16 HYPERLINK l _Toc523139562 3. Aprofundarea literaturii de specialitate. PAGEREF _Toc523139562 h 18 HYPERLINK l _Toc523139563 3.1 Analiza spectrala a EEG-ului PAGEREF _Toc523139563 h 18 HYPERLINK l _Toc523139564 3.2 Analiza neliniara a EEG PAGEREF _Toc523139564 h 18 HYPERLINK l _Toc523139565 3.3 Modele autoregresive ale EEG PAGEREF _Toc523139565 h 19 HYPERLINK l _Toc523139566 3.3.1 Selectia ordinului unui model AR PAGEREF _Toc523139566 h 20 HYPERLINK l _Toc523139567 3.4 Analiza multielectrod EEG PAGEREF _Toc523139567 h 21 HYPERLINK l _Toc523139568 3.5 Clasificarea cuvintelor / Clasificarea epilepsiei. PAGEREF _Toc523139568 h 21 HYPERLINK l _Toc523139569 3.6 Ferestre EEG PAGEREF _Toc523139569 h 21 HYPERLINK l _Toc523139570 3.6.1 Medierea trasaturilor pe baza Ferestrelor PAGEREF _Toc523139570 h 22 HYPERLINK l _Toc523139571 3.7 Eliminarea statisticilor eronate PAGEREF _Toc523139571 h 23 HYPERLINK l _Toc523139572 4. Metodologie PAGEREF _Toc523139572 h 24 HYPERLINK l _Toc523139573 4.1 Prezentare generala PAGEREF _Toc523139573 h 24 HYPERLINK l _Toc523139574 4.2 Colectarea datelor PAGEREF _Toc523139574 h 24 HYPERLINK l _Toc523139575 4.2.1 Demografie PAGEREF _Toc523139575 h 24 HYPERLINK l _Toc523139576 4.2.2 Inregistraile EEG PAGEREF _Toc523139576 h 26 HYPERLINK l _Toc523139577 4.2.3 Alegerea electrodului de referinta PAGEREF _Toc523139577 h 26 HYPERLINK l _Toc523139578 4.3 Pre-procesarea datelor PAGEREF _Toc523139578 h 27 HYPERLINK l _Toc523139579 4.4 Extragerea trasaturilor PAGEREF _Toc523139579 h 27 HYPERLINK l _Toc523139580 4.4.1 Realizarea ferestrelor EEG PAGEREF _Toc523139580 h 27 HYPERLINK l _Toc523139581 4.4.2 Medierea pe ferestre PAGEREF _Toc523139581 h 28 HYPERLINK l _Toc523139582 4.5 Selectia parametrilor PAGEREF _Toc523139582 h 28 HYPERLINK l _Toc523139583 4.6 Selectia trasaturilor PAGEREF _Toc523139583 h 28 HYPERLINK l _Toc523139584 5. Rezultate si observatii PAGEREF _Toc523139584 h 29 Capitolul 1. Motivatie Dezvoltarea in domeniul inteligentei artificiale permite folosirea sistemelor de calcul pentru rezolvarea problemelor care pana acum credeam ca numai oamenii sunt capabili sa le realizeze. Avansarile in domeniul prelucrarii ed semnale ne-au permis sa cuantificam chiar si modificari subtile in comportament in moduri care pana acum nu erau posibile. Prin combinarea expresiilor matematice cu puterea computationala se doreste realizarea a mai multor instrumente pentru domeniul clinic si aducerea diagnosticelor neurologice in epoca informationala. 1.1 Electroencefalografia Din punct de vedere al dezavantajelor, precum fRMN exista aspectul rezolutiei spatiale mici, acapararea dificila a surselor de adancime si dificultatea reconstruirii surselor de curent intercraniene unice pentru un smenal EEG. Inregistrarile EEG luate la nivel de suprafata de pe scalp constituie in totalitate. In aceasta lucrare se va folosii un EEG neinvaziv plasat pe scalp. Datele EEG sunt achizitionate printr-un sistem EEG de tip …. Electrozii au fost pozitionati utilizati folosind sistemul 10-20. Toate datele au fost analizate pentru a verifica integritatea acestora din moment ce erori pot aparea in momentul inregistrarii, precum electrozi plasati in mod eronat. Toti subiectii cu date EEG in care se observau probleme au fost eliminati. 1.1.2 Benzi de frecventa Benzile Gamma sunt cele mai pronuntate langa corexul somatosenzorial. Sunt cel mai bine evidentiate prin procesarea senzoriala multimodala in care multiple senzatii sau amintiri sunt antrenate. 1.1.2.2 Banda Beta (12 30 Hz) Avand amplitudini reduse in comparative cu undele alfa, undele Beta sunt asociate cu starile de anxietate, tensiune sau concentrare activa. Undele Beta sunt cele mai pronuntate in regiunile frontale ale creierului. 1.1.2.3 Banda Alfa (8 12 Hz) Benzile Alfa sunt asociate cu starile de relaxare si reflectie, mai ales atunci cand ochii sunt inchisi. Deasemenea sunt asociate cu controlul inhibitiilor. Sunt cele mai pronuntate in regiunile posterioare si occipitale ale creierului. 1.1.2.4 Banda Theta (4 8 Hz) Ritmurile Theta sunt amplificate in timpul somnului si sunt asociate cu somnolenta. Undele theta sunt localizate in regiunea hipocampuslui si au fost asociate cu formarea de memorie4 si capacitatea de navigatie5. 1.1.2.5 Banda Delta (1 4 Hz) Localizate la adulti in partea frontala, undele delta se manifesta in timpul somnului adanc si foarte adanc. Amplitudinea undelor delta este relativ mai mare comparativ cu celelalte benzi. 1.2 Provocari Tehnice 1.3 Contributii 2. Background Tehnic 2.1 Modele Matematice Se vor prezenta modele matematice pentru caracterizarea semnalelor, acestea fiind expuse dupa domeniile de unde origineaza. 2.1.1 Frecventa-timp 2.1.1.1 Energia Semnalului Prima metrica definita este energia semnalului. Aceasta este utila mai ales cand se vor observa diferente benzi de frecventa a semnalului, x. Pentru modelul necesar in acest caz energia semnalului este definita ca (2.1) unde QUOTE ( QUOTE , QUOTE sunt transformatele Fourier discrete ale lui x. Folosind teorema lui Parseval rezulta ca energia semnalului este egala cu suma patratelor de magnitudine pe toate componentele de frecvanta ale densitatii spectrale de energie a semnalului, si acea eneregie de semnal este egala cu suma patratelor de magnitudine in domeniul timp. 2.1.1.2 Cross-covarianta Cross-covarianta este o masura a similitudinii a doua semnale, si este o functie ce arata timpul relativ intre cele doua semnale. Pentru doua procese aleatoare stationare, x1 si x2, secventa de cross-covarianta (covm) este cross-corelatia secventelor. unde m este defazajul x1, QUOTE este media lui x1, si QUOTE este media lui x2. Specific, cross-covarianta este calculata ca (2.2) 2.1.2 Teoria Informatiei 2.1.2.1 Histograme O parte din indicatori necesita calculul probabilistic dintr-un semnal EEG discret. Acest lucuru este realizat prin aproximarea functiei de denistate probabilistica (PDF) cu o functie de masa probabilistica (PMF) ce este derivata dintr-o histograma realizata pe baza datelor.Histograma este compartimentalizata in umatorul mod Pentru N date de intrare se o clasa de intervale de QUOTE , o alegere motivata pe baza criteriului Scott6, si a deviatiei standard medie gasite in datele EEG. 2.1.2.2 Coeficientul de autocorelatie Autocorelatia este o functie ce poate fii folosita pentru a detecta elementele nealeatoare din date si pentru a identifica un model de serie de timp in cazul in care datele sunt nealeatoare7. Coeficientul de autocorelatie, Rm, pentru defazajul m este definit ca (2.3) Unde N este numarul de observatii si QUOTE este media semnalului x, definita ca 2.1.2.3 Entropia Entropia (H) masoara incertitudinea medie a unui semnal. Pentru un semnal continuu, entropia masurata in nats este definita ca (2.4) Unde i cuprinde toate amplitudinile semnalului iar Pi reprezinta probabilitatea ca semnalul sa contina o amplitudine ai. Prin urmare pentru in semnal serie de timp trebuie estimata functia densitate probabilistica a semnalului ce ocupa un anumit interval al amplitudinilor. Acest lucru este realizat prin construirea unei histograme a amplitudinilor conform modalitatii prezentate la punctul 2.1.2.1. Odata calculata histograma, este normalizata astfel incat sa reprezinte functia probabilistica de masa. Din aceasta se poate calcula entropia, H, cu formula prezentata anterior8. 2.1.2.4 Entropia Spectrala Entropia Spectrala (SpE) extinde definitia entropiei in domeniul frecventa. Prin urmare, calculam entropia coeficientilor FFT. O rezolutie mai mare se poate atinge prin calculul entropiei pentru fiecare banda de frecventa. 2.1.2.6 Sample Entropy Sample entropy (SampEn) este folosita in analizarea complexitatii semnalelor in serie de timp phisiologice fiind capabila sa detecteze stari alterate. SampEn este logaritmul negativ al unei estimari a probabilitatii conditionale ca o secventa de lungime d care corespunde in limitele unei tolerante r, va corespunde si in cazul urmatorului punct9. demonstratie 2.1.3 Modele Parametrice 2.1.3.1 Coeficienti autoregresivi Vom nota un model autoregresiv de ordin p ca AR(p). Pentru un semnal x, AR(p) este definit ca (2.5) Unde QUOTE 1, …, QUOTE sunt parametrii modelului, QUOTE este o constanta, iar QUOTE este zgomot alb Gaussian. Prin urmare, putem interpreta procesul autoregresiv ca iesirea unui filtru IIR unde intrarea este un zgomot alb. Parametrii QUOTE descriu spectrul semnalului. Cu toate ca modelele autoregresive reflecta proprietatiile semnalului, comparat cu transformarile Fourier discrete, favorizeaza semnalul nu semnalul impreuna cu zgomotul.10 In contextul analizei EEG, vom modela semnaul serie de timp EEG ca un model autoregresiv. Exista cateva metode pentru estimarea coeficientilor AR precum ecuatiile Yule-Walker .In practica metoda utilizata va fi metoda Burg11 pentru determinarea coeficientilor. 2.2 Background pentru machine learning Dupa extragerea informatiilor din semnalul EEG prin folosirea metodelor prezentate anterior, acestea vor fi folosite ca si trasaturi pentru caracterizarea datelor. Datorita faptului ca se lucreaza pe inregistrari provenite de la un aparat cu xcanale, si investigam masuratori care implica mai multi electrozi, avem un numar foarte mare de trasaturi pentru realizarea investigatiei. Datorita volumului mare de date, acestea nu pot fi procesate manual, de aceea trebuie sa se recurga la o schema automata de marcare a trasaturilor relevante pentru investigatie. In continuare vor fi prezentate metode de reducere a numarului de trasaturi la un numar usor de folosit metode de extragere a trasaturilor (2.2.1) si metode de clasificare (2.2.2). Pentru setul m al exemplelor de intrare, fiecare avand n trasaturi, si setul corespunzator al iesirilor etichetate. 2.2.1 Metode de extragere a trasaturilor Algoritimii pentru selectia trasaturilor ofera o modalitate de reducere a dimensiunii setului de trasaturi folosindule doar pe cele importante. Aceasta abordare prezinta doua beneficii crestea acuratetea clasificarilor, si permite reducere numarului de trasaturi astfel incat algoritmul poate fi interpretat de catre utilizator totodata, mai putine trasaturi inseamna mai putine resurse computationale folosite. Motiv pentru care, daca avem un set de intrare X cu m exemple de date de intrare, fiecare avand n trasaturi cu corespondenta in etichetele de iesire Y, dorim sa reducem dimensionalitaea setului X astfel inacat sa avem r trasaturi, in acelasi timp dorind sa mentinem cele mai imporatante informatii din setul de date, si abilitatea de a prezice eticheta de iesire a unui set de intrare. In practica, metodele de selectie pot fi impartite in 3 abordari 12 Metode de filtrare Metode embedded Metode wrapper Metodele de filtrare sunt metodele de selectie cele mai simple, si in general primele care sunt aplicate pentru reducerea setului de trasaturi extrase. Metodele de filtrare folosesc proprietati ale datelor care sunt independente de clasificator, si includ masuratori sttatistice precum corelatia13. O metoda simpla de extragere a trasaturilor utilizand o schema de filtre poate implica eliminarea tuturor trasaturilor unde valoarea absoluta coeficientilor de corelatie a trasaturii cu o eticheta de iesire este sub o valoare predeterminata. Metodele de tip wrapper optimizeaza setul de trasaturi astfel incat acesta sa fie conform cu un indicator anume, in general acesta fiind clasificatorul de performanta. Un algoritm de tip greedy, care justeaza setul de trasaturi in mod repetat, cautand sa identifice setul de trasaturi cu cea mai buna performanta a clasificarii este un exemplu de metoda de tip wrapper. In acest sens algoritmul greedy inveleste clasificatorul. Metodele de tip embedded sunt incluse in o parte a anumitor clasificatori, de exemplu pentru analizarea leziunilor cerebrale optime sau detectia automata a relevantei in retele neuronale. Distinctia esentiala in cazul metodelor embedded este ca formularea clasificatorului actioneaza in vederea slectiei de trasaturi. In timpul antrenarii retelei neuronale pentru leziuni cerebrale, reteaua va reduce ponderile anumitori trasaturi, realizand in acest mode si selectia de trasaturi. Metodele de filtrare sunt robuste in cazul problemelor de overfitting, si sunt rapide, cu toate acestea ele pot da gres in cazul identificarii celor mai importante trasaturi. Metodele wrapper pot in principiu- sa gaseasca cele mai relevante trasaturi, dar sunt predispuse la problemele de overfitting si necesita putere de calcul mai mare. In final, metodele de tip embedded sunt similare cu metodele wrapper, cu toate nu sunt la fel de dispuse la overfitting si necesita mai putine resurse computationale in functie de modul de implementare. 2.2.1.1 Coeficientul de corelatie Pearson Coeficientul de corelatie Pearson masoara similaritatea a doua semnale. Pentru x (x1,…,xm)T reprezentand valorile anumitori trasaturi pentru m indivizi, si y (y1,…,ym)T reprezentand etichetele de iesire corespunzatoare, coeficientul de corelatie Pearson este (2.6) Unde QUOTE si sx reprezinta media esantionului si deviatia standard a lui x, si QUOTE si sy reprezinta media esantionului si deviatia standard a lui y. Prin urmare o valoare mai mare indica o corelatie liniara mai mare intre o trasatura si o eticheta a clasei14. 2.2.1.2 Algoritm greedy Un algoritm de tip greedy este un algortim care ia decizia optima locala la fiecare pas15. Scopul algorimtilor de tip greedy este sa gaseasca un optim global intr-un numar cat mai mic de pasi. In practica, este dificil de evaluat performanta unui algoritm greedy apriori. In probleme cu substructura optimala, unde o solutie optima a problemei contine solutii optime ale subproblemelor, algoritmi de tip greedy reprezinta cea mai buna solutie pentru rezolvarea problemei. Exista totusi probleme in care o abordare de tip greedy ar genera cea mai nedorita solutie. In contextul selectiei de trasaturi, algoritmi de tip greedy reprezinta una din cele mai simple solutii, acestia fiind robusti atunci cand se pune problema de overfitting. Algoritmi greedy pot fi folositi in doua moduri, fie prin forward selection sau prin backwards elimination. Forward selection se refera la abordarea problemei cu un set gol de trasaturi ca mai apoi la fiecare trecere a algorimului trasaturi sa fie adaguate. In general, obiectivul functiei pentru optimizare il reprezinta acuratetea clasificarii pe setul de antrenare. Backwards elimination face referire la o abordare in care se porneste cu toate trasaturile posibile, iar la fiecare trecere a algorimului sa fie eliminate cele care nu sunt optime. Notam cu fx(x) valoarea functiei obiective in raport cu setul de trasaturi curent, x, evaluat la trasatura x. In cazul selectiei de tip forwards aveasta va fi valoarea lui f evoaluata pe un set xx, si in cazul eliminarilor backwards, valoarea lui f va fi evaluata pe un set x-x. De exemplu daca f este acuratetea clasificarii, atunci fx(x) este acuratetea clasificarii masurate folosind setul de trasaturi x x. 2.1.2.3 Algoritimi Genetici Un algoritm genetic este o familie de algoritmi de optimizare stochiastica inspirati din evolutia biologica. Algoritmul 3 prezinta un exemplu canonic al unui algoritm genetic. Vom folosi acest tip de algoritm pentru selectia de trasaturi, motiv pentruc are vom considera un set de trasaturi de dimensiune N, ca pe un cromozom, si un set de cromozomi ca pe elementele constituente a unei populatii. In cazul fiecarei iterari ( numita si generatie), cromozomul parinte produce un set de cromozomi copii, care alcatuiesc populatie urmatoarei generatii. In acest caz, un algoritm genetic poate fi clasificat ca o metoda de tip wrapper pentru selectia de trasaturi. Functia fitness ce va fi evaluata va fi considerata ca un test pentru evakuarea erori de clasificare, masurata prin cross-validare. 2.2.2 Clasificari Metodele de clasificare ofera o modalitate automata de a discrimina intre doua clase de variabile. Daca avem un set de antrenare, Xtrain, cu etichetele asociate Ytrain, si un set de testare Xtest, se doreste estimarea etichetelor de iesire pentru datele din Xtest pe baza datelor de antrenament. Clasificatorii reprezinta metodele matematice pentru realizarea acestui lucru. 2.2.2.1 Analiza linear discriminanta ( LDA Linear Discriminant Analysis) 2.2.2.2 Support Vector Machines (SVM) Support Vector Machines (SVM) sunt o tehnica recent aparuta de clasificare propusa original de Cortes si Vapnik17. Formularea matematica a SVM-urilor poate fi exemplificata printr-un caz simplu in care avem un SVM liniar cu date separabile si mai apoi extinsa unui SVM cu kernel arbitrar si date neseparabile. Pentru datele de antrenare definite prin se va cauta hiperplanul care maximizeaza punctele care au ca eticheta yi – 1 fata de punctele care au eticheta yi 1. Definim hiperplanul ca Folosind hiperplanul definit anterior se obtine o regula de decizie naturala QUOTE . Daca construim un hiperplan care partitioneaza in mod clar clasele atunci se poate afirma ca datele sunt separabile liniar (vezi Fig.). Presupunand ca avem speratie liniara, putem selecta doua hiperplanuri paralele care sa nu aiba puncte intre ele si mai apoi sa maximizam distanta. Distanta intre doua hiperplane este QUOTE , motiv pentru care se doreste minimizarea lui QUOTE . Trebuie de asemenea sa ne asiguram ca nu exista puncte in marginile de separatie. Acest lucru poate fi exprimat ca o constrangere Prin urmare avem urmatoarea problema de optimizare (2.7) Aceasta este o problema de optimizare convexa datorita criteriilor patratice ale constrangerilor liniare inegale, si poate fi rezolvata prin tehnici standard in cazul SVM-urilor liniare in cazul datelor separabile. In cazul kernel trick-urilor se porneste de la idea existentei a doua seturi de puncte in spatiul S care nu sunt separabile liniar, pot fi separate liniar intr-un spatiu V care este un spatiu multidimensional ce poate fi realizat prin proiectia QUOTE . Prin urmare se pot realiza rate de clasificare mult mai bune sau chiar perfecte in spatiul V, comparativ cu spatiul S. Data fiind mapping-ul QUOTE se poate calcula produsul dintre vectori x,x QUOTE S proiectat in spatiul V ca Daca calculam functia k(x,x), numita kernel, putem reprezenta un clasificator SVM in spatiul multidimensional V fara a cartografia in mod explicit toate punctele in V. In mod practic, acest lucru inseamna inlocuirea produsilor din derivatia SVM anterioara cu kernelul ales. O functie arbitrara este un kernel valid daca exista produs spatial (potential infinit dimensional) corespunzator. Figure SEQ Figure ARABIC 2.1Ilustrare a unui SVM18 Pornind de la discutia anterioara se vom porni de la un kernel arbitrar k(x,x), si fara prezumtia de liniaritate (Figura 2.1b) va fi definit modelul liniar (2.8) unde QUOTE este un mapping al trasaturii in spatiu. Acest model liniar are asociat regula de clasificare naturala QUOTE , unde QUOTE reprezinta estimarea clasei lui xi. Cum am mentionat anterior, dorim sa lucram cu functiile kernel-ului si nu cu reprezentarea explicita a trasaturilor vectorilor. In general setul nostru de date nu va fi separabil liniar, ca sa suplinim acest lucru vom incerca sa maximizam marginile dintre clase si in acelasi timp sa permitem cateva cazuri de clasificare eronata. Pentru a modela gradul de clasificare eronata a lui xi vom introduce o serie de variabile non-negative, QUOTE . Vom modifica apoi constrangerile originale (2.2.2.2) astfel incat rezulta unde QUOTE , o constanta. c este in esenta un parametru de regularizare controland echilibrul dintre eroarea la antrenare si complexitatea modelului. Pentru valori mai mari ale lui c, SVM-ul va prezenta un comportament similar unei margini definitorii a clasificatorului prezentand o tendinta de overfitting iar pentru valori mai mici SVM-ul va avea o tendinta de undefitting a datelor. Overfitting-ul este ilustrat in Figura 2.2 iar detaliile acestei probleme se pot gasi in Sectiunea 2.2.3. 2.2.3 Problema supra-antrenarii Problemele de supra-antrenare overfiting fac referire la un model predictiv care invata sa clasifice zgomotul si variatii statistice in detrimentul modelarii statistece ale relatiilor intre datele de intrare si etichetele de iesire adevarate. Figura 2.3 ilustreaza aceasta problema din punctul de vedere a clasificatorului. Linia verde arata supra-antrenarea, in timp ce linia neagra prezinta o aproximare mult mai buna a separarii optime intre clasele albastre si cele galbene. Supra-antrenarea prezinta o mare problema in cazul acestei lucrari datorita numarului mare de predictori (trasaturi) relativ fata de numarul de observatii (indivizi). Supra-antrenarea se manifesta ca un model predictiv ce atinge un grad foarte mare de acurtate pe setul de antrenare, acuratete care nu se manifesta si pe setul de date folosit pentru testare. In practica, multi algoritmi rezolva problema overfiting-ului prin introducerea unor penalizari pentru variatii. Acest lucru este cunoscut ca regularizare. 2.3 Acuratetea masuratorilor Dupa ce se stabilesc metodele de clasificare, este nevoie de dezvoltarea unei metode de masurare a performantei clasificatorilor pe datele noastre, pentru a simula performanta in cazul unei aplicatii parctice. In general, metode de reesantionare statistica sunt folosite pentru masurarea acurateti, si pentru a forma estimari ale preciziei in functie de date. 2.3.1 Metode de re-esantionare Metodele de re-esantionare sunt metode statistice de masurare a proprietatilor datelor prin exantionari aleatoare. 2.3.1.1 Test de permutare Un test de permutare este un test statistic significant unde probabilitatea unei ipoteze nule este obtinuta prin masuratori ale unui test statistic aplicat tuturor permutarilor etichetelor pentru datele observate. Considerand coeficientul de corelatie Pearson (rxy) ca test statistic un test de permutare masoara probabilitatea ca o corelatie mai mare sau cel putin egala va fi gasita daca trasatura nu are nicio asociere cu clasa14. Prin urmare , un test de permutare poate fi folosit pentru a determina ce tresaturi au cele mai importante asocieri cu etichetele unei clase. O trasatura cu o asociere puternica va avea cele mai multe asocieri signifiante poate fi folosita mai departe in aplicatie. 2.3.1.2 Crosvalidarea Crosvalidarea este o metoda statistica folosita pentru a determina cat de exact un model predictiv va fi in practica. Crosvalidarea implica runde multiple in care datele sunt partitionate in subseturi complementare 18, 20. In fiecare etapa, un subset de antrenament este considerat ca set de test. Modelul predictiv este antrenat pe setul de antrenare, iar acuratetea predictiei este masurata pe setul de test. Acest proces este repetat pentru fiecare partitie a datelor, iar acuratetea predictiilor pentru toate partitiile este mediata pentru a oferi o estimare finala a acuratetii modelului predictiv. Numarul de partitii este egal cu numarul de runde de crosvalidare.Numarul de partitii este cunoscut ca numarul de folds. Figure 2.2 Ilustrare a problemei de supraantrenare 3. Aprofundarea literaturii de specialitate. Aceasta tehnica a fost folosinta intr-un numar mare de studii incepand din anii 1960. Multe studii de asemenea au aratat ca exista anormalitati EEG in general in regiunile frontale ale creierului, dar o localizare spatiala a efectelor nu a fost gasita. S-a notat in schimb existenta in zonele frontale a unei activitati a undelor delta. In aditie s-a postulat ca anormalitatile spectrale nu au fost induse sau afectate intr-un mod signifiant de medicatie. Studiile din jurnal au folosit metode statistice obisnuite dar metode de analiza avansata nu au fost aplicate. 3.2 Analiza neliniara a EEG Diverse tehnici de analiza neliniara au fost folosite in analiza EEG cu rezultate incurajatoare in diverse zone neurologice. Analiza neliniara a fost folosita pentru prima data in studiul semnalelor EEG in 1980 datorita diverselor studii care au creata abordarile teoretice necesare. De exemplu, in 1981, Floris Takens a publicat teorema embedding ce a oferit conditiile necesare prin care atractorul unui sistem neliniar putea fi reconstruit intr-un mod sigur. Analize ce incorporeaza teoria haosului si dinamica neliniara au fost folosite cu mult succes in domeniul epilepsiei, si intr-o mai mica masura in cercetarea bolii Alzheimer. Pentru o vedere de ansambul a acestor tehnici facem referire la Adeli et al.21. Tehnici de analiza dinamica neliniara au fost folosite de asemenea pentru clasificarea diverselor stari mentale, inclusiv efectele muzicii si stimulare reflexologica, sedarea indusa medical22 si analiza somnului23. Aceste studii au concluzionat ca tehnicile neliniare sunt eficiente pentru realizarea clasificarilor, si in anumite cazuri, surclaseaza tehnicile liniare. In 1996 un studiu23 a concluzionat ca tehnicile bazate in totalitate pe sisteme dinamice neliniare ofera rezultate mult mai bine din punct de vedere al clasificarii starii somnului decat metodele bazate pe analiza spectrala. Mai multe metoda de masurare atat spectrala cat si neliniara pentru diferentierea discriminanta a somnului au fost comparate. Masuratorile spectrale au inclus (i) puterea delta relativa, (ii) entropia spectrala, (iii) marginea spectrala, (iv) si primul moment spectral masuratorile neliniare au inclus (i) corelarea dimensiunii, (ii) cel mai mare exponent Lyapunov, (iii) entropia Kologorov aproximata, si (iv) masurarea stochiastica in domeniul timp a entropiei amplitudinilor. Utilizand o analiza discriminanta multivariata, cea mai mare rata de clasificare atinsa a fost o medie de 79.2 pe etapele somnului. … 3.3 Modele autoregresive ale EEG Conform descrierii de la 2.1.3.1, un model autoregresiv (AR) este o metoada de reprezentare a unui semnal in domeniul timp ca iesirea unui filtru IIR all-pole ce are un zgomot alb Gaussian ca intrare. Un model autoregresiv apartine clasei de modele cunoscute ca modele parametrice, clasa ce include modele precum ARMA si GARCH24. Teoretic vorbind, un model AR este unul dintre cele mai simple modele parametrice. In 1995 s-a postulat in lucrarea Evaluarea metodelor parametrice in analiza semnalelor EEG25 ca modele de tip AR ofera cea mai precisa reprezentare atunci cand este comparata cu alte modele parametrice. Acuratetea reprezentarii a fost masurata prin aplicarea semnalului EEG pe modelul parametric invers. Rezultatul obtinut este zgomot alb, iar nivelul de alb masurat prin profilul de frecventa uniform caracterizeaza acuratetea reprezentarii. In practica, modelele AR au fost folosite extensiv in cazul interfetelor de tip BCI pe baza EEG (pentru o vedere de ansamblu se recomanda Studiul algoritmilori de procesare a semnalului in interfete creier-masina pe baza semnalelor electrice ale creierului26). Anumite studii au avut succes in folosirea modelelor AR in clasificarea starilor creierului27 si a conditiilor neurologice. Anderson si Sijeric27 au folosit un model de ordin 6 pentru clasificarea starii mentale. S-a folosit un model de tip ANN feedforward cu 2 si 3 layere pentru recunoastere. Cea mai mare acuratete a clasificari a fost de 71 iar cea mai scazuta a fost 37 in cazul a 4 subiecti si a celor 5 sarcini mentale ce au trebuit indeplinite. Modele de tip AR au fost folosite si in studii specifice retelelor artificiale neuronale pe baza EEG. Intr-un astfel de studiu un model AR de ordin opt este adapatat pe date EEG si mai apoi este folosit ca intrare pentru un perceptron multi-layer (MLP) intro retea neuronala (NN)28. Autorul a folosit urmatoarea procedura pentru clasificare Datele au fost intai inregistrate la o frecventa de 128 Hz cu un filtru trece-jos de 30 Hz pentru inlaturarea componentelor de inalta frecventa. Numai canalul Cz a fost folosit in lucrare. Semnalul EEG a fost mai apoi divizat in doua ferestre de o secunda iar coeficientii AR au fost calculati pentru fiecare ferestrea pe un interval de 250 de secunde in final fiind realizata media pe toate ferestrele. Setul de antrenare a fost compus din 5 subiecti normali, 5 subiecti ce sufera de schizofrenie, si 5 subiecti ce sufera de tulburari obsesiv-compulsive. Un MLP cu 8 neuroni la intrare, 15 layere ascunse si 3 noduri de iesire a fost folosit pentru clasificare. Datele de test au fost alcatuite din 6 subiecti normali, 8 subiecti schizofrenici si 10 subiecti cu tulburari obsesiv-compulsive. Reteaua a clasificat in mod corect aproape toti subiectii cu exceptia a doi dintre ei. O observatie interesanta este ca performanta medie a masuratorilor depaseste performanta individuala. Rationamentul furnizat ca justificare a medierii consta in faptul ca datele EEG prezinta un nivel ridicat de zgomot. Prin urmare in cazul unei analize cadru cu cadru a trasaturilor exista variatii rapide intr-un interval scurt de timp. Prin urmare medierea reduce efectul zgomotului. Aceasi autori au realizat un studiu ulterior in care au comparat performanta unui model AR cu performanta unui model parametric biliniar29.S-a concluzionat ca modelul biliniar ofera o acuratete predictiva mai buna decat modelul AR. Conditiile studiului au fost similare, o retea neuronala MLP a fost folosita ca si clasificator si doar electrodul Cz a fost folosit. O diferenta notabila este faptul ca trasaturile nu au fost mediate. De mentionat este si faptul ca nu au reusit sa reproduca acuratetea clasificarii studiului initial. 3.3.1 Selectia ordinului unui model AR Pe baza cercetarii lui Tsoi si colab. se poate afirma ca modelul AR este indicativ al continutului spectral al semnalului. Ca urmare s-a investigat ordinul optim pentru dezvolatarea unui model cu aplicatii EEG folosind diverse conditii de testare (potentiale evocate, activitate spontana tranzitorie si in desfasurare)25. In general, un model de ordin n indica faptul ca semnalul este alcatuit din n/2 frecvente. Datorita faptului ca in cercetarea originala banda gamma a fost exculsa din analiza avem patru componente principale delta, theta, alfa si beta. Prin urmare, un model de ordin opt reprezinta componentele frecventei semnalului EEG. Mentionam ca in studiile citite in care s-au realizat ferestre pe semnalul de tip EEG, majoritatea au mediat metricile calculate over windows. 