Uzm. Ody. Soner Türüdü

Akustik Ses Analizinde Kullanılan Parametreler ve Yazılımlar

Akustik Ses Analizinde Kullanılan Parametreler ve Yazılımlar

Ses, doğadaki esnek cisimlerin titreşiminden oluşan fiziki bir enerjidir. Katı, sıvı ve gaz ortamlarında sıkışma-seyrelme dalgaları şeklinde ilerler. İnsan sesi ise ses kıvrımlarının titreşimi ile ortaya çıkar. Son yıllarda kullanımı yaygınlaşan ses analiz yöntemleri, sesin normal olup olmadığını saptamak, eğer patolojik ise patolojinin derecesini belirlemek ve mevcut olan patolojik durumun hangi mekanizmalar ile oluştuğunu daha iyi anlayabilmek için kullanılmaktadır.

Akustik ses analizi, objektif parametrelere dayanılarak yapılan ve istenildiğinde kolaylıkla tekrarlanabilen, periyodik ses dalgalarının değerlendirilmesinde kullanılan bir yöntemdir.
Akustik ses analizi için pahalı sistemlerin kullanılmasına gerek yoktur. Standart ses kayıt sistemi ile ücretsiz programlar da çok iyi sonuçlar vermektedir.

MDVP, Dr. Speech, Praat, LingWAVES, SpeechTool, VoxMetria ve TF32 akustik ses analizinde kullanılan yazılımlardır. En sık kullanılan yazılımlar ücretli olan MDVP ile ücretsiz olan Praat’tır. Bu iki yazılımda değerlendirilen parametreler arasında yüksek korelasyon görülmektedir.

Ses analizinde değerlendirilen en basit ses, dolayısıyla parametre, f0’dır ve temel frekans olarak adlandırılır. Akustik ses analizinde kullanılan parametreler genel olarak f0 ve f0 değişiklikleri; Ötüm parametreleri (Voicing grubu); Frekans pertürbasyonu parametreleri (Jitter grubu); Genlik (Amplitüd) pertürbasyon parametreleri (Shimmer grubu); Spektral parametreler (Harmonicity grubu); GHO (gürültü-harmonik oranı) ve HGO (harmonik-gürültü oranı); Spektral eğim parametreleri’ni içermektedir.

Araştırmanın amacı; ses hastalıklarının teşhisinde akustik ses analizinin önemini vurgulamak, kullanılan parametreleri ve yazılımları göstermek; gelecekte yapılması planlanan çalışmalar için temel bir kaynak olmasını sağlamaktır.

Araştırma, gözden geçirme/review ve durum bildirme özelliği taşımaktadır. Bu nedenle, ses analizinde kullanılan yazılımlar ve değerlendirilen parametreler, detaylı bir şekilde güncel kaynaklar ile taranmış olup; çeşitli makaleler, dergiler ve yayınlardan faydalanılmıştır.

Akustik Ses Analizinde Kullanılan Yazılımlar Nelerdir?

MDVP (Multi-Dimensional Voice Program) Kay Elemetrics (NJ, ABD) tarafından CSL ve Multispeech programları altında çalıĢacak Ģekilde üretilen bu yazılımda ses kalitesini değerlendiren 33 parametre ölçülmektedir.

MDVP Ekran görüntüsü

CSL / Multi-Speech (http://www.kayelemetrics.com) CSL sistemi, yazılım ile ses arayüzü özelliği olan harici bir modülden oluşmaktadır. Multi-Speech ise hemen hemen aynı işlevi gören, standart ses kartlarıyla uyumlu çalışan bir yazılımdır. Bu çekirdek programlarla birlikte kullanılan MDVP ile perde, jitter, shimmer, ötüm parametreleri, spektral parametreler ölçülebilmektedir. Fonetagram için kullanılan Voice Range Profıle yazılımı sadece CSL altında çalışmakta ve özel bir mikrofon kullanımını gerektirmektedir. Satış fiyatı pakete eklenen programlara göre değişmekle birlikte yüksektir. Deneme versiyonu yoktur.

Multi-Speech

Vocal Assessment (Tiger’s Electronics, Neu-Anspach, Germany)
Dr. Speech program grubunda yer alan bu programla Vocal Assessment yazılımı ile Jitter, Shimmer, Mean F0, NNE, HNR (Harmonics to noise ratio) parametreleri ölçülebildiği gibi, Voice Quality Estimate modülü ile de Jitter (%), Simmer (%), SD F0 ve NNE parametreleri kullanılarak RBH sistemine benzer objektif parametrelere dayalı algısal değerlendirme yapılabilmektedir.

Vocal Assessment

Praat programı (Boersma&Weenink) Amsterdam üniversitesinden Paul Boersma ve David Weenink tarafından tasarlanan, geliştirilen ve akustik ses analizinde kullanılan ücretsiz bir yazılım programıdır. Program üzerinde kullanıcının ekleme ve değişiklik yapabilmesi de artı özelliğidir. MDVP ile ölçülenlere benzer şekilde perde, jitter, shimmer, HNR gibi parametreler ölçülebilmektedir. Ücretsiz bir program olmasına rağmen, son derece güvenilir sonuçlar vermektedir. Kılıç et al. (2006), üç farklı analiz programı kullanarak, ortam gürültüsünün pertürbasyon analizi üzerindeki etkisini araştırmış, Praat’ın MDVP ve Dr. Speech Vocal Assessment Programlarına göre ortam gürültüsünden daha az etkilendiğini bulmuşlardır.

Praat

LingWAVES (http://www.wevosys.com), bu analiz sisteminin en kapsamlı olan Voice Clinic Suite Pro versiyonuyla, jitter, shimmer gibi geleneksel parametrelere ek olarak, DSI, GNE gibi parametreler de ölçülebilmekte, fonetegram yapılabilmekte ve ayrıca vizüel analog skala üzerinde RBH sistemine benzer bir şekilde algısal değerlendirme yapabilmektedir.

LingWAVES

Dr. Speech (http:/ /www.drspeech.com): Bu grup içinde yer alan yazılımlar birbirine bağlı olmadığı için ayrı ayrı da satın alınabilir. Vocal Assessment yazılımıyla ses kalitesiyle ilgili, perde, jitter, shimmer parametreleri, spektral parametreler ölçülebilmekte, Voice Quality Estimates özelliğiyle algısal değerlendirme yapılabilmektedir.

Dr.Speech

VoxMetria Dr. Mara Behlau desteğinde CTS Informatica firması tarafından geliĢtirilen bu program ile F0, Jitter (PPQ), Shimmer (EPQ), Correlation, GNE parametreleri ölçülmekle birlikte en önemli özelliği görsel olarak GHD (Göttingen ses kısıklığı diyagramı) göstermesidir. Bu diyagramda iki boyutlu olarak Irregularity (Jitter, Shimmer, Correlation) Noise (GNE) değerlendirilmesi yapılmaktadır.

VoxMetria

Akustyk (http:/ /bartus.org/akustyk/), Praat ile birlikte kullanılan ücretsiz Akustyk yazılımıyla spektral parametreler (eğim ve nazalite) ölçülebilmektedir.

TF32 (Time-Frequency analysis software, 32 bit), yazılımı Paul H. Milenkovic tarafından tasarlanan ses analiz programıdır.

GHD (http:/ /www.dpi.physik.uni-goettingen.de/ -micha/hd.html), MS-DOS altında çalışan ücretsiz bir yazılımdır. Bu yazılımla, FO, jitter (RAP), shimmer (APQlS), CORR, GNE parametreleri yanında diyagram çiziminde kullanılan Irregularity ve Noise parametreleri ölçülebilmekte, ancak diyagram çizilememektedir.

SpeechTool (http:/ /homepages.wmich.edu/ -hillenbr/), CPP ve CPPS (düzeltilmiş CPP) analizi yapabilen ücretsiz bir programdır.

Akustik Ses Analizinde Kullanılan Parametreler Nelerdir?

Tüm parametrelere yer verememekle birlikte, sayın KILIÇ academia hesabında tüm bilgiler detaylı şekilde mevcuttur.

Jitter, periyotlar arası değişikliği gösteren parametedir. Vibratuvar döngü frekansının sonraki döngü frekansına göre değişkenliğidir.
Mutlak Jitter (Jita; Praat: local, absolute) analiz edilen sesin her periyodunun, kendinden sonraki periyot ile farkının mutlak değeri olup F0’a göre değişiklik gösterir. Yüzde Jitter (%Jit; praat: jitter, local) mutlak Jitter’in F0’a bağlı olarak değişiklik göstermesi sakıncasını ortadan kaldırmak için ortalama periyoda bölünmesi ile elde edilir. Jitter ses kıvrımlarının düzensizliğini yansıtır ve frekans pertübasyonu olarak da adlandırılır. Normal değeri % 1’in altındadır.

Shimmer Mutlak Shimmer (Desibel-dB, ShdB) ya da yüzde Shimmer
(% Shim) olarak ifade edilir. Mutlak Shimmer her bir döngüdeki amplitüt varyasyonu belirtir. Kısa aralıklarla ses dalgasının amplitütleri arasındaki rölatif değişikliği göstermektedir. Yüzde Shimmer her periyodun kendinden sonraki periyotla arasındaki Şiddet farkının mutlak değerinin ortalamasını ortalama periyot şiddetine bölerek elde edilir, normal değeri % 3’ün altındadır.

Spektral Parametreler İnsan sesinin içerdiği farklı frekanslar ve bunlara ait şiddetler, Fourier dönüşümü kullanılarak, perde özelliği x ekseninde, şiddet özelliği y ekseninde gösterilebilir. Bu dönüşüm, kısa süreli segmentler üzerinde ve seriler halinde uygulanırsa hızlı Fourier dönüşümü (Fast Fourier Transform, FFT), uzun bir segment üzerinde ortalama alınarak uygulanırsa uzun süreli ortalama spektrogram (Long Time Average Spectrogram, LTAS) adını alır. Spektral parametreler, bu şekilde ortaya konan farklı frekans bölgelerine ait şiddet toplamları oranlanarak hesaplanır. Bu grupta yer alan parametreler, yetersiz glotik kapanma sonucu ortaya çıkar. Türbülans gürültüsü yanında, yüksek frekanslı harmoniklerin şiddetinin hipofonksiyona bağlı olarak azalmasını veya hiperfonksiyona bağlı olarak yükselmesini de gösterir.

Harmonik gürültü oranı (Harmonic-to-Noise Ratio, HNR): Temel frekans ve onun katları olan harmoniklerin toplam enerjisinin gürültü enerjisine oranıdır. Birimi dB olup yüksek değerler sesteki gürültü oranının düşük olduğunu gösterir. MDVP ile ölçülmeyen bu parametre, Praat ve Dr. Speech Vocal Assessment (Tiger DRS, Ine.) ile ölçülebilmektedir.

Gürültü harmonik oranı (Noise-to-Harmonic Ratio, NHR): HNR parametresinin modifiye edilmiş şeklidir. HNR’nin aksine bu parametrenin değeri, sesteki gürültü miktarıyla doğru orantılı olarak değişir.

Spektral eğim ölçümü: Hl-H2 (1. harmonik yani FO ile 2. harmonik arasındaki şiddet farkı) ve H1-Al, H1-A2, HlA3 (1. harmonikle sırasıyla 1., 2. ve 3. formantın en yüksek harmoniği arasındaki şiddet farkı) gibi spektral eğimi gösteren parametreler, solukluluk göstergesi olarak kullanılabilir.(Hanson, 1997) MDVP ile ölçülmeyen bu parametreler, bir Praat eklentisi olan Akustyk (Plichta) yazılımıyla ölçülebilmektedir.

Yukarıda belirtilen yazılımlar ve parametreler kullanılarak pek çok bilimsel, akademik yayın ortaya konmuştur.

Yukarıdaki iki ekran görüntüsü de PubMed’den alınmıştır. biri 1955 yılına ait diğeri ise 2020 yılına. Elli yılı aşkın süredir yapılmakta olan akustik ses analizi çalışmaları oldukça geniş bir spektruma sahip olmakla birlikte pek çok yeni teknoloji ile gerek hastalık tanısı koymada gerekse tedavi seçeneklerinde yol gösterici olabilmektedir.

Ülkemizde sayın Mehmet Akif Kılıç, özelleştirilmiş Praat ve diğer yazılımlar ile ses analizini; sistem oldukça kompleks olmasına rağmen, basite indirgeyerek bir çok araştırmacı için yol gösterici olmuştur ve olmaya devam etmektedir. Kendisinin de dediği gibi, akustik ses analizine dair halihazırda dört dörtlük değil, dört birlik bile tam bir metin yokken; verdiği notlar ve paylaştığı bilgiler ile ses analiz alanına ışık tutmaktadır.

  • Kaynakça:
  • Aronson AE, Bless DM. Klinik Ses Bozuklukları (Çev: Kılıç MA, Oğuz H) s. 355-376, Nobel Tıp Kitabevleri, Adana, 2012.
  • Kılıç MA. Evaluation of the patient with voice problem by objective and subjective methods. Curr Pract ORL 2010; 6(2): 257-265.
  • Kılıç MA, Okur E. CSL ve Dr.Speech ile ölçülen temel frekans ve pertürbasyon değerlerinin karĢılaĢtırılması. KBB ĠhtisDerg 2001;8:152-157.
  • Samian RA. Ses analizi. Ed: Cummings CW, Flint PW, Harker LA ve ark. Cummings otolaringoloji baĢ ve boyun cerrahisi. (Çev: Koç C.) s. 2008-25, Cilt 3, 4. Basım, GüneĢ Tıp Kitabevi, Ankara, 2007.
  • Sarıca S, Ses Analizinde Kullanılan Akustik Parametreler, Tıpta Uzmanlık Tezi
  • Kılıç MA, Ses Problemi Olan Hastanın Objektif Değerlendirilmesi,

BİR YORUM YAZIN

ZİYARETÇİ YORUMLARI - 0 YORUM

Henüz yorum yapılmamış.