Rețea neuronală convoluțională cu
9 straturi pentru identificarea automată a bătăilor cardiace în semnalele ECG
Mihai Oșan, Dan Proca, Stefan
Sebastian Szabo
Acest studiu prezintă o rețea neuronală
convoluțională cu 9 straturi (CNN) pentru identificarea automată a cinci tipuri
diferite de bătăi cardiace în semnalele electrocardiogramă (ECG). ECG-ul este
un test standard utilizat pentru monitorizarea activității inimii și poate
indica o serie de anomalii cardiace, cum ar fi aritmia. Diagnosticarea
aritmiilor se bazează pe identificarea și clasificarea corectă a bătăilor
cardiace normale și anormale pe baza morfologiei ECG. Bătăile cardiace pot fi
împărțite în cinci categorii: non-ectopice, ectopice supraventriculare,
ectopice ventriculare, fusionate și bătăi necunoscute.
Diferențierea acestor bătăi cardiace în
semnalele ECG este o sarcină dificilă și consumatoare de timp, deoarece aceste
semnale sunt adesea corupte de zgomot. Autorii au dezvoltat un CNN cu 9
straturi pentru a identifica în mod automat cele cinci categorii de bătăi
cardiace în semnalele ECG. Experimentul a fost realizat pe seturi de semnale
ECG originale și atenuate de zgomot, obținute dintr-o bază de date publică.
Setul de date a fost augmentat artificial pentru a echilibra numărul de
instanțe ale celor cinci clase de bătăi cardiace și filtrat pentru a elimina
zgomotul de înaltă frecvență.
CNN-ul a fost antrenat utilizând datele
augmentate și a obținut o acuratețe de 94,03% și 93,47% în clasificarea diagnostică
a bătăilor cardiace în ECG-urile originale și cele fără zgomot, respectiv. Când
CNN a fost antrenat cu date extrem de dezechilibrate (setul de date original),
acuratețea acestuia a scăzut la 89,07% și 89,3% în ECG-urile cu zgomot și cele
fără zgomot. Când este antrenat corespunzător, modelul CNN propus poate servi
ca un instrument pentru screening-ul ECG-urilor, pentru a identifica rapid
diferite tipuri și frecvențe de bătăi cardiace aritmice.
1.
Introducere
Bolile cardiovasculare (CVD) reprezintă principala
cauză de mortalitate la nivel mondial, cu aproximativ 17,7 milioane de decese
în 2015. Există trei categorii principale de CVD: electrice (aritmii),
circulatorii (tulburări ale vaselor de sânge) și structurale (boli ale
mușchiului cardiac). Acest studiu se concentrează pe aritmii, adică tulburările
electrice ale inimii. Aritmiile pot fi lente, rapide sau neregulate și pot fi
clasificate în periculoase pentru viață și non-periculoase. Diagnosticarea
aritmiilor se bazează pe identificarea bătăilor cardiace normale și anormale în
electrocardiograme (ECG) și pe clasificarea precisă a acestora în funcție de
morfologia ECG. Conform Asociației pentru Avansarea Instrumentației Medicale
(AAMI), aritmiile non-periculoase pot fi împărțite în 5 clase principale:
non-ectopice (N), ectopice supraventriculare (S), ectopice ventriculare (V),
fusionate (F) și necunoscute (Q). ECG-ul este o metodă obișnuită de
monitorizare a ritmului și ratei cardiace și poate detecta multe anomalii și
disfuncții ale sistemului electric al inimii. Fiecare clasă ECG are implicații
și tratamente diferite, astfel încât identificarea corectă a tipului de
eveniment ECG anormal este esențială înainte de
administrarea tratamentului.
2.
Baza
de date a ECG
Semnalele ECG ale bătăilor cardiace sunt
obținute din baza de date open-source PhysioBank MIT-BIH Arrhythmia. Aceasta
include înregistrări ECG de 48 de jumătăți de oră de la 47 de subiecți,
obținute cu ajutorul semnalului ECG Lead II. Fiecare semnal este eșantionat la
360 Hz, iar fiecare bătaie ECG are 260 de eșantioane. Înregistrările au fost
interpretate și validate de cel puțin doi cardiologi. Un total de 109.449 de
bătăi ECG au fost extrase pentru acest studiu. Setul original de bătăi este
zgomotos și a fost supus unui proces de eliminare a zgomotului. Astfel, primul
set de date originale (set A) conține semnale ECG fără eliminarea zgomotului,
în timp ce al doilea set (set B) conține semnale ECG care au trecut printr-un
filtru digital atenuator de zgomot.

3.
Metodologie
Această lucrare prezintă o abordare nouă
pentru detectarea automată a claselor N, S, V, F și Q ale bătăilor cardiace
ECG. Un model CNN este antrenat cu setul A și apoi cu setul B pentru a evalua
performanța acestuia. În plus, sunt introduse date sintetice pentru a echilibra
numărul de eșantioane prezentat în tabelul de mai sus.
4.
Preprocesarea
Semnalele ECG dobândite sunt preprocesate prin
eliminarea zgomotului utilizând filtre Daubechies wavelet 6 și segmentarea
bătăilor cardiace conform adnotărilor oferite de cardiologi. Detectarea
vârfului R se realizează folosind algoritmul Pan-Tompkins, iar semnalele ECG
sunt segmentate în porțiuni de 260 de eșantioane, centrate în jurul vârfurilor
R detectate. Fiecare segment este apoi normalizat prin normalizarea Z-score
pentru a aborda problema scalării amplitudinii. Semnalele preprocesate sunt
ulterior utilizate pentru antrenarea și testarea rețelei neuronale
convoluționale (CNN).
5.
Generarea
de date sintetice
Datele sintetice sunt utilizate pentru a
compensa dezechilibrul numărului de bătăi cardiace ECG în cele cinci clase (N,
S, V, F, Q). Eșantioanele de date sintetice sunt generate după preprocesare,
prin modificarea deviației standard și a mediei Z-score calculate din semnalele
ECG normalizate originale. Segmentele din clasa N rămân neschimbate, deoarece
sunt cele mai abundente. Numărul segmentelor rămase este mărit pentru a se
potrivi cu numărul de segmente din clasa N. După augmentare, numărul total de
segmente în clasele N, S, V, F și Q a crescut la 452.960 de bătăi.
6.
Arhitectura
modelului CNN
Arhitectura modelului CNN propus este
alcătuită din 9 straturi, inclusiv 3 straturi convoluționale, 3 straturi de
max-pooling și 3 straturi complet conectate. Pentru fiecare strat
convoluțional, straturile sunt convolute cu dimensiunile nucleelor
corespunzătoare (3, 4 și 4). După fiecare strat convoluțional, se aplică o
operație de max-pooling pe hărțile de caracteristici pentru a reduce
dimensiunea acestora. Parametrii pentru dimensiunea nucleului (filtru) sunt
obținuți prin tehnica forței brute, iar pasul pentru operațiile de convoluție
și max-pooling este setat la 1 și 2, respectiv. Funcția de activare LeakyReLU
este utilizată pentru straturile 1, 3, 5, 7 și 8. Straturile complet conectate
conțin 30, 20 și 5 neuroni de ieșire în stratul final (stratul 9). Funcția
softmax este utilizată pentru a genera rezultate separate pentru fiecare clasă:
N, S, V, F și Q. Operația de convoluție este calculată folosind o
ecuație specificată.


Modelul CNN a fost antrenat folosind tehnica
backpropagation, cu o dimensiune a eșantionului de 10. Hiperparametrii, precum
regularizarea, rata de învățare și parametrul momentum, au fost setați la 0,2,
3x10-3 și 0,7, respectiv. Aceștia previn supraadaptarea datelor și controlează
viteza de învățare în timpul antrenamentului. Parametrii sunt ajustați în mod
corespunzător prin tehnica forței brute pentru a obține performanțe optime. De
asemenea, ponderile și bias-urile sunt actualizate prin două ecuații prezentate.
Antrenarea și testarea algoritmului au fost efectuate în 20 de epoci, iar
validarea a fost realizată după fiecare epocă. O abordare de validare
încrucișată în zece pliuri a fost utilizată, împărțind bătăile cardiace ECG în
10 părți egale și repetând metoda de 10 ori, rotind datele de test. Performanța
modelului a fost evaluată prin specificitate,
sensibilitate și acuratețe.
7.
Rezultate
si discutii
Algoritmul CNN propus a fost antrenat pe un PC
și a durat aproximativ 9573,2 secunde și 9586,7 secunde pentru a finaliza o
epocă de antrenament pentru setul A și B. Matricele de confuzie pentru cele
două seturi arată că mai puțin de 12% și 10% din bătăile ECG au fost
clasificate greșit, respectiv. Modelul CNN antrenat cu date echilibrate a avut
o performanță mai bună decât cel antrenat cu date dezechilibrate. Avantajele
modelului propus includ automatizarea completă, insensibilitatea la calitatea
semnalului ECG și implementarea validării încrucișate în zece pliuri.
Dezavantajele includ timpul lung de antrenament, necesitatea unui hardware
specializat și a unui număr mare de imagini pentru antrenament. Odată antrenat,
sistemul poate fi implementat în mediul clinic pentru a ajuta la diagnosticarea
obiectivă a semnalelor ECG.
Niciun comentariu:
Trimiteți un comentariu