marți, 30 mai 2023

Rețea neuronală convoluțională cu 9 straturi pentru identificarea automată a bătăilor cardiace în semnalele ECG

 

Rețea neuronală convoluțională cu 9 straturi pentru identificarea automată a bătăilor cardiace în semnalele ECG

 

Mihai Oșan, Dan Proca, Stefan Sebastian Szabo

 

Acest studiu prezintă o rețea neuronală convoluțională cu 9 straturi (CNN) pentru identificarea automată a cinci tipuri diferite de bătăi cardiace în semnalele electrocardiogramă (ECG). ECG-ul este un test standard utilizat pentru monitorizarea activității inimii și poate indica o serie de anomalii cardiace, cum ar fi aritmia. Diagnosticarea aritmiilor se bazează pe identificarea și clasificarea corectă a bătăilor cardiace normale și anormale pe baza morfologiei ECG. Bătăile cardiace pot fi împărțite în cinci categorii: non-ectopice, ectopice supraventriculare, ectopice ventriculare, fusionate și bătăi necunoscute.

Diferențierea acestor bătăi cardiace în semnalele ECG este o sarcină dificilă și consumatoare de timp, deoarece aceste semnale sunt adesea corupte de zgomot. Autorii au dezvoltat un CNN cu 9 straturi pentru a identifica în mod automat cele cinci categorii de bătăi cardiace în semnalele ECG. Experimentul a fost realizat pe seturi de semnale ECG originale și atenuate de zgomot, obținute dintr-o bază de date publică. Setul de date a fost augmentat artificial pentru a echilibra numărul de instanțe ale celor cinci clase de bătăi cardiace și filtrat pentru a elimina zgomotul de înaltă frecvență.

CNN-ul a fost antrenat utilizând datele augmentate și a obținut o acuratețe de 94,03% și 93,47% în clasificarea diagnostică a bătăilor cardiace în ECG-urile originale și cele fără zgomot, respectiv. Când CNN a fost antrenat cu date extrem de dezechilibrate (setul de date original), acuratețea acestuia a scăzut la 89,07% și 89,3% în ECG-urile cu zgomot și cele fără zgomot. Când este antrenat corespunzător, modelul CNN propus poate servi ca un instrument pentru screening-ul ECG-urilor, pentru a identifica rapid diferite tipuri și frecvențe de bătăi cardiace aritmice.

 

1.     Introducere

Bolile cardiovasculare (CVD) reprezintă principala cauză de mortalitate la nivel mondial, cu aproximativ 17,7 milioane de decese în 2015. Există trei categorii principale de CVD: electrice (aritmii), circulatorii (tulburări ale vaselor de sânge) și structurale (boli ale mușchiului cardiac). Acest studiu se concentrează pe aritmii, adică tulburările electrice ale inimii. Aritmiile pot fi lente, rapide sau neregulate și pot fi clasificate în periculoase pentru viață și non-periculoase. Diagnosticarea aritmiilor se bazează pe identificarea bătăilor cardiace normale și anormale în electrocardiograme (ECG) și pe clasificarea precisă a acestora în funcție de morfologia ECG. Conform Asociației pentru Avansarea Instrumentației Medicale (AAMI), aritmiile non-periculoase pot fi împărțite în 5 clase principale: non-ectopice (N), ectopice supraventriculare (S), ectopice ventriculare (V), fusionate (F) și necunoscute (Q). ECG-ul este o metodă obișnuită de monitorizare a ritmului și ratei cardiace și poate detecta multe anomalii și disfuncții ale sistemului electric al inimii. Fiecare clasă ECG are implicații și tratamente diferite, astfel încât identificarea corectă a tipului de eveniment ECG anormal este esențială înainte de administrarea tratamentului.

 

2.     Baza de date a ECG

Semnalele ECG ale bătăilor cardiace sunt obținute din baza de date open-source PhysioBank MIT-BIH Arrhythmia. Aceasta include înregistrări ECG de 48 de jumătăți de oră de la 47 de subiecți, obținute cu ajutorul semnalului ECG Lead II. Fiecare semnal este eșantionat la 360 Hz, iar fiecare bătaie ECG are 260 de eșantioane. Înregistrările au fost interpretate și validate de cel puțin doi cardiologi. Un total de 109.449 de bătăi ECG au fost extrase pentru acest studiu. Setul original de bătăi este zgomotos și a fost supus unui proces de eliminare a zgomotului. Astfel, primul set de date originale (set A) conține semnale ECG fără eliminarea zgomotului, în timp ce al doilea set (set B) conține semnale ECG care au trecut printr-un filtru digital atenuator de zgomot.






 

3.     Metodologie

Această lucrare prezintă o abordare nouă pentru detectarea automată a claselor N, S, V, F și Q ale bătăilor cardiace ECG. Un model CNN este antrenat cu setul A și apoi cu setul B pentru a evalua performanța acestuia. În plus, sunt introduse date sintetice pentru a echilibra numărul de eșantioane prezentat în tabelul de mai sus.

 

4. Preprocesarea

Semnalele ECG dobândite sunt preprocesate prin eliminarea zgomotului utilizând filtre Daubechies wavelet 6 și segmentarea bătăilor cardiace conform adnotărilor oferite de cardiologi. Detectarea vârfului R se realizează folosind algoritmul Pan-Tompkins, iar semnalele ECG sunt segmentate în porțiuni de 260 de eșantioane, centrate în jurul vârfurilor R detectate. Fiecare segment este apoi normalizat prin normalizarea Z-score pentru a aborda problema scalării amplitudinii. Semnalele preprocesate sunt ulterior utilizate pentru antrenarea și testarea rețelei neuronale convoluționale (CNN).

 

5. Generarea de date sintetice

Datele sintetice sunt utilizate pentru a compensa dezechilibrul numărului de bătăi cardiace ECG în cele cinci clase (N, S, V, F, Q). Eșantioanele de date sintetice sunt generate după preprocesare, prin modificarea deviației standard și a mediei Z-score calculate din semnalele ECG normalizate originale. Segmentele din clasa N rămân neschimbate, deoarece sunt cele mai abundente. Numărul segmentelor rămase este mărit pentru a se potrivi cu numărul de segmente din clasa N. După augmentare, numărul total de segmente în clasele N, S, V, F și Q a crescut la 452.960 de bătăi.

 

6. Arhitectura modelului CNN

Arhitectura modelului CNN propus este alcătuită din 9 straturi, inclusiv 3 straturi convoluționale, 3 straturi de max-pooling și 3 straturi complet conectate. Pentru fiecare strat convoluțional, straturile sunt convolute cu dimensiunile nucleelor corespunzătoare (3, 4 și 4). După fiecare strat convoluțional, se aplică o operație de max-pooling pe hărțile de caracteristici pentru a reduce dimensiunea acestora. Parametrii pentru dimensiunea nucleului (filtru) sunt obținuți prin tehnica forței brute, iar pasul pentru operațiile de convoluție și max-pooling este setat la 1 și 2, respectiv. Funcția de activare LeakyReLU este utilizată pentru straturile 1, 3, 5, 7 și 8. Straturile complet conectate conțin 30, 20 și 5 neuroni de ieșire în stratul final (stratul 9). Funcția softmax este utilizată pentru a genera rezultate separate pentru fiecare clasă: N, S, V, F și Q. Operația de convoluție este calculată folosind o ecuație specificată.


 


Modelul CNN a fost antrenat folosind tehnica backpropagation, cu o dimensiune a eșantionului de 10. Hiperparametrii, precum regularizarea, rata de învățare și parametrul momentum, au fost setați la 0,2, 3x10-3 și 0,7, respectiv. Aceștia previn supraadaptarea datelor și controlează viteza de învățare în timpul antrenamentului. Parametrii sunt ajustați în mod corespunzător prin tehnica forței brute pentru a obține performanțe optime. De asemenea, ponderile și bias-urile sunt actualizate prin două ecuații prezentate. Antrenarea și testarea algoritmului au fost efectuate în 20 de epoci, iar validarea a fost realizată după fiecare epocă. O abordare de validare încrucișată în zece pliuri a fost utilizată, împărțind bătăile cardiace ECG în 10 părți egale și repetând metoda de 10 ori, rotind datele de test. Performanța modelului a fost evaluată prin specificitate, sensibilitate și acuratețe.

 

7. Rezultate si discutii

Algoritmul CNN propus a fost antrenat pe un PC și a durat aproximativ 9573,2 secunde și 9586,7 secunde pentru a finaliza o epocă de antrenament pentru setul A și B. Matricele de confuzie pentru cele două seturi arată că mai puțin de 12% și 10% din bătăile ECG au fost clasificate greșit, respectiv. Modelul CNN antrenat cu date echilibrate a avut o performanță mai bună decât cel antrenat cu date dezechilibrate. Avantajele modelului propus includ automatizarea completă, insensibilitatea la calitatea semnalului ECG și implementarea validării încrucișate în zece pliuri. Dezavantajele includ timpul lung de antrenament, necesitatea unui hardware specializat și a unui număr mare de imagini pentru antrenament. Odată antrenat, sistemul poate fi implementat în mediul clinic pentru a ajuta la diagnosticarea obiectivă a semnalelor ECG.

 

Niciun comentariu:

Trimiteți un comentariu

MNIST Digit Classification

  MNIST MNIST este un set de date clasic în domeniul recunoașterii de imagini, utilizat  pentru a antrena și evalua algoritmi de învățare au...