Lista przedmiotów z materiałami udostępnionymi dla studentów

Dla_studentów
  • Increase font size
  • Default font size
  • Decrease font size

Hubert Kowalczyk

Analiza komputerowa obrazów laryngoskopowych rejestrowanych za pomocą szybkiej kamery


Computer analysis of laryngoscopic images recorded by high speed camera


Opiekun pracy dyplomowej: prof. dr hab. inż. Paweł Strumiłło
Praca dyplomowa inżynierska obroniona 2020-02-18
Streszczenie pracy dyplomowej:
Choroby głośni są schorzeniami zawodowymi dotykającymi osoby, które w swojej pracy narażone są na wysiłek głosowy. Celem pracy było opracowanie algorytmu do analizy obrazów laryngoskopowych rejestrowanych za pomocą szybkiej kamery. Algorytm napisano z użyciem języka Python3 oraz biblioteki OpenCV. Analizie poddano nagrania wideo rejestrowane za pomocą tzw. szybkiej kamery zapisującej 3000 obrazów na sekundę. Nagrania pochodzą od 12 pacjentów. Wśród nich były osoby zdrowe oraz takie, u których występowały zmiany chorobowe: guzki fałdów głosowych i niedomykanie fałdów głosowych. Na podstawie wydzielonego światła głośni w każdym obrazie sekwencji wideo wyznaczono glottowibrogramy oraz glottovelogramy. Te przestrzenno-czasowe zobrazowania fonacji głośni umożliwiły wyznaczenie szeregu parametrów geometrycznych i czasowych charakteryzujących kinematykę fałdów głosowych. Wyznaczonymi parametrami były: min/max objętość GAW, stosunek Prędkości. Parametry te są podstawą diagnozy foniatrycznej. Słowa kluczowe: Python, OpenCV, laryngoskopia, guzki głosowe, niedomykalność fałdów głosowych
Abstract:
Diseases of the glottis are occupational diseases affecting people who are exposed to voice effort in their work. The aim of the work was to develop an algorithm for the analysis of laryngoscopic images recorded with a fast camera. The algorithm was written using Python3 and OpenCV libraries. Videos were recorded using so-called fast camera recording 3000 images per second. The films come from 12 patients. Among them were healthy people and those with lesions: vocal fold nodules and regurgitation of the vocal folds. Glottovibrograms and glottovelograms were built based on the generated glottal area in each video sequence image. These space-time imaging of glottis phonation enabled the determination of a series of geometrical and time parameters characterizing the kinetics of the vocal folds. The parameters determined were: min / max GAW volume, Speed ratio. These parameters are the basis of the phoniatric diagnosis. Key words: Python, OpenCV, laryngoscopy, vocal nodules, regurgitation of the vocal folds