Ses Kodlama Teknikleri ve Yeni NATO Ses
Transkript
Ses Kodlama Teknikleri ve Yeni NATO Ses
TÜBİTAK UEKAE ULUSAL ELEKTRONİK ve KRİPTOLOJİ ARAŞTIRMA ENSTİTÜSÜ Ses Kodlama Teknikleri ve Yeni NATO Ses Kodlama Seçimi (NATO STANAG 4591) Dr. Hasan Palaz Tel: 0 262 648 1369 e-Posta: palaz@uekae.tubitak.gov.tr Aralık 2003 TÜBİTAK UEKAE ULUSAL ELEKTRONİK ve KRİPTOLOJİ ARAŞTIRMA ENSTİTÜSÜ Birinci Bölüm Ses Kodlama Teknikleri Kısa Bir Bakış ve Tarihçe Dr. Hasan Palaz Tel: 0 262 648 1369 e-Posta: palaz@uekae.tubitak.gov.tr Aralık 2003 Sunuş Planı Ses üretim mekanizması İnsan kulağının bant genişliği Kullanım amacı ve alanı Tarihçe,Sınıflandırma ve Özellikleri Standartları hazırlayan organizasyonlar Ses kodlama standartları Ses kalitesine göre kodlayıcılar NATO ses kodlama seçimi – Giriş NATO ses kodlayıcıları STANAG 4591 ihtiyacı Ses Kodlayıcı Teknolojisinde Yönelim 18.12.2003 H. Palaz, TÜBİTAK UEKAE 3 Ses Üretim Mekanizması Ses üretim yolu olarak adlandırılan çok karmaşık ancak tam anlamıyla mükemmel bir sistem, Ses tellerinden geçen hava daha sonra ses üretim yolunda işlenerek değişik sesler çıkartılıyor. 18.12.2003 H. Palaz, TÜBİTAK UEKAE 4 Ses Üretim Mekanizması Ana olarak iki tür ses üretiriz, sesli (voiced) ve sessiz (unvoiced) Buna örnek olan iki farklı konuşma işareti 18.12.2003 H. Palaz, TÜBİTAK UEKAE 5 Ses Üretim Mekanizması Ses üretiminin iyi bir modeli aşağıdaki örnek sistem gibi şematize edilebilir. Bu sistemde sesli heceler için ardışık darbe dizileri, sessiz heceler için ise gürültü işareti süzgeçlerin girişine uygulanır. Pitch period Impulse Train Generator LPC Coefficients Voiced/ Unvoced Switch x[n] Random Noise Generator 18.12.2003 X u[n] Time Varying Filter Syntesized Speech s[n] Gain H. Palaz, TÜBİTAK UEKAE 6 İnsan Kulağının Bant Genişliği 5 Hz - 20 kHz SES TELEFON 0 Hz 18.12.2003 MUZİK (CD KALİTESİ) 4 kHz 7 kHz H. Palaz, TÜBİTAK UEKAE 20 kHz 7 Kullanım Amacı Haberleşme kapasitesini arttırmak 8000 örnek/s x 12-16 bit=96-128kbps Efektif haberleşme Emniyetli ses haberleşmesi Efektif depolama 18.12.2003 H. Palaz, TÜBİTAK UEKAE 8 Kullanım Amacı Haberleşme A/D A/D Konuşma Analiz Analiz Kayıt Sentez Sentez D/A D/A Dinle Çalma Depolama 18.12.2003 H. Palaz, TÜBİTAK UEKAE 9 Kullanım Alanı Emniyetli ses haberleşmesi (Secure voice) Hücresel telefonlar (GSM, PCS v.b.) Sesli mesaj (Voice mail) Çoklu ortam mesaj (multimedia messaging) Sayısal telesekreter makineleri (digital answering machine) Paket telefon ve radyo (packet telephony&radio) Görüntülü telefon (videophone) Sesli-görsel telekonferans (audio-visual teleconferencing) 18.12.2003 H. Palaz, TÜBİTAK UEKAE 10 Tarihçe VOICE CODER-VODER-VOCODER Bell Labs, 1936, H.W. Dudley İlk ve en ilkel ses kodlayıcı Kodlayıcıdan çok piyano gibi tuşları olan bir sentezleyici ancak çoğu modern ses kodlama/ sıkıştırma algoritmaları benzer mantıkla çalışıyor. Yapay Konuşan Makine, Dünyadaki ilk elektronik ses sentezleyici New York ve San Francisco World's Fairs of 1939. 18.12.2003 H. Palaz, TÜBİTAK UEKAE 11 Tarihçe-Emniyetli Ses Sistemleri SIGSALY 1943 1200bps Vakum tüp teknolojisi 12 adet kuruldu 55 ton Roosevelt-Churchill 18.12.2003 H. Palaz, TÜBİTAK UEKAE 12 Tarihçe-Emniyetli Ses Sistemleri KY-9 HY-2 1953 1961 1650bps ???bps Tranzistorlu Tranzistorlu 565 pounds 100 pound Johnson Johnson 18.12.2003 STU-1 Orijinal STU-II 1979 1982 2400bps 2400bps İlk DSP’li Bir kaç yüz cihaz kuruldu Bir kaç bin cihaz kuruldu H. Palaz, TÜBİTAK UEKAE 13 Tarihçe-Emniyetli Ses Sistemleri STU-II ve STU-II/B • 1980 Sonları 2400 bps VLSI Teknolojisi 4-5 Kg NATO Standartı 18.12.2003 STU-III 1990 Ortaları 2400-9600 bps VLSI Teknolojisi 4-5 Kg STE 1990 Sonları 2400-9600 bps Analog 64-128 kbps ISDN STU-III uyumlu VLSI Teknolojisi 4-5 Kg H. Palaz, TÜBİTAK UEKAE 14 Sınıflandırma Dalga kodlama (waveform coders) Parametrik olmayan, model tabanlı değil Düşük oranda sıkıştırma PCM, ADPCM, CVSD Ses kodlama (Vocoder) Model tabanlı, parametrik Yüksek oranda sıkıştırma LPC, CELP 18.12.2003 H. Palaz, TÜBİTAK UEKAE 15 Özellikleri Kodlama Hızı (Bit Rate) Karmaşıklık (Complexity) Gecikme (Delay) Kalite (Quality) 18.12.2003 H. Palaz, TÜBİTAK UEKAE 16 Kodlama Hızı Kodlayıcının çalıştığı haberleşme kanalının hızı • Sayısal telefon şebekesi 64 kbps • Hücresel şebeke 6.7 - 13 kbps • Emniyetli telefon 2.4 - 4.8 kbps • HF emniyetli ses 1.2 - 2.4 kpbs • CDMA sayısal hücresel Değişken hızlı şebeke, IP tabanlı şebekeler 18.12.2003 H. Palaz, TÜBİTAK UEKAE 17 Karmaşıklık Kodlayıcının hesaplama karmaşıklığı, işlem yükü Gerçek zamanda çalışma için gerekli olan MIPS (million instruction per second) Bellek miktarı Güç harcaması Fiyat Gerçekleme ortamları Sayısal işaret işleyicilerde (DSP) gerçekleme Internet telefon PC üzerinde çalışır 18.12.2003 H. Palaz, TÜBİTAK UEKAE 18 Gecikme Haberleşme kanalında ses kodlayıcının sebep olduğu gecikme Algoritmik gecikme Ses örnekleri üzerinden çalışan kodlayıcıların gecikmesi küçüktür Ses örnek çerçeveleri (blokları) ile çalışan kodlayıcıların gecikmesi daha büyüktür Hesaplama gecikmesi Ses kodlama tekniğinin hesaplama karmaşıklığına bağlıdır 18.12.2003 H. Palaz, TÜBİTAK UEKAE 19 Kalite Anlaşılabilirlik (Speech Intelligibility) Akustik Gürültü Performansı Ses Kalitesi (Speech Quality) Konuşanın Tanınabilirliği (Speaker Recognizability) Emotional Projection Tandem Performansı Haberleşme Verimliliği (Communicability) 18.12.2003 H. Palaz, TÜBİTAK UEKAE 20 Organizasyonlar U.S. Department of Defence, National Security Agency (NSA) NATO International Telecommunications Union (ITU-CCITT) Telecommnications Industry Association (TIA) Research and Development Center for Radio Systems (RCR) in Japan International Maritime Satellite Corporation (INMARSAT) Europan Telecommunications Standards Institute (ETSI) 18.12.2003 H. Palaz, TÜBİTAK UEKAE 21 Standartlar Hız(kbps) Standart 64 64, 56, 48 32 2.4 16 13 (22.8) 4.8 8.9 (9.6) 7.95 (13) 4.8 16 6.7 (11.2) 4.15 (6.4) ITU G.711 PSTN PCM ITU G.722 ISDN SB-ADPCM ITU G.721 PSTN ADPCM US-FS1015 Secure Voice LPC-10e Inmarsat-B Maritime APC FR-GSM, EGSM, DCS-1800 RPE-LTP US-FS1016 Secure Voice CELP Inmarsat-aero Skyphone MPELPC IS-54 NA-Digital cellularVSELP NASA MSAT-X Mobile satellite VAPC ITU G.728 PSTN LD-CELP FR-PDC Japan Cellular VSELP Inmarsat-M Land mobile satellite IMBE 18.12.2003 Uygulama H. Palaz, TÜBİTAK UEKAE Algoritma Yıl 1972 1984 1984 1984 1985 1988 1989 1989 1989 1990 1991 1991 1991 22 Standartlar Hız(kbps) Standart 4.4 (7.2) 4.53 (7.2) 8-1, 19.2-2.4 8 5.7 (11.4) 3.45 (5.6) 4.8 13 (22.8) 13 (22.8) 6.4/5.3 2.4 1.2/4.8/9.6 1.2/2.4+npp APCO Paramilitary TETRA Europan trunk radio IS-95 VR NA CDMA cellular ITU G.729 PSTN HR-GSM Europan GSM HR-PDC Japan Cellular Inmarsat-M Land mobile satellite Enhanced FR-GSM Europan GSM PCS-1900 NA-Digital cellular G.723.1 PSTN FS-MELP Secure Voice IS-127 NA CDMA cellular STANAG 4195 Secure Voice 18.12.2003 Uygulama H. Palaz, TÜBİTAK UEKAE Algoritma IMBE ACELP QCELP ACELP VSELP PCI-CELP AMBE ACELP ACELP MPC-MLQ MELP EVRC MELPe Yıl 1992 1993 1993 1995 1995 1995 1995 1995 1995 1995 1996 1997 2002 23 Ses Kalitesi Ses Kalitesi, MOS Mükemmel (5) TOLL ITU-T 1998 İyi (4) G.729 EFR-GSM HABERLEŞME IMBE IS-54 FS-1016 CELP 1.2 Zayıf (2) G.728 SKYPHONE G.721 FR-GSM FS-MELP Orta (3) G.711 G.726 FS-1015 LPC10E CVSD SENTETİK Kötü (1) 18.12.2003 1 2 4 8 Bit Rate, kbps H. Palaz, TÜBİTAK UEKAE 16 32 64 24 Ses Kalitesi “If you knew Julian like I know Julian” cümlesi 18.12.2003 H. Palaz, TÜBİTAK UEKAE 25 NATO Ses Kodlama Seçimi - Giriş 18.12.2003 H. Palaz, TÜBİTAK UEKAE 26 NATO Ses Kodlayıcıları Kullanımda olan NATO ses kodlayıcıları uzun süre önce standart haline getirilmiştir (10-20 yıl) Başlıca öne çıkan özellikleri: STANAG 4209 (1983), haberleşme kanalındaki bozulmalara karşı dayanıklı (CVSD) STANAG 4198 (1987), düşük hız, dar bant (LPC-10e) STANAG 4479 (1993), oldukça düşük hız, daha dar bantlı (LPC tabanlı) Fakat servis kaliteleri sınırlı 18.12.2003 H. Palaz, TÜBİTAK UEKAE 27 NATO Ses Kodlayıcıları STANAG 4209 (1983) – CVSD “The NATO Multi-Channel Tactical Digital Gateways Standards for Analogue to Digital Conversion of Speech Signals” Dalga kodlama (Waveform Coder) + Haberleşme kanalındaki bozulmalara dayanıklı + Küçük gecikme - Gürültüsüz ortamda düşük ses kalitesi - Yüksek hız, geniş bant (16 kbps) UHF/VHF emniyetli ses cihazı (KY-58/57) Frekans atlamalı VHF FH telsizler Uydu terminalleri (SATCOM) Sayısal geçitler (Gateway) 18.12.2003 H. Palaz, TÜBİTAK UEKAE 28 NATO Ses Kodlayıcıları STANAG 4198 (1987) – LPC-10e “Parameters and coding characteristics that must be common to assure interoperability of 2400 bps linear predictive encoded digital speech” Ses kodlayıcı, parametrik (Vocoder) Emniyetli ses haberleşmesinde ve sinyal işlemede önemli bir kilometre taşıdır + düşük hız, dar bant (2.4 kbps) - düşük ses kalitesi - kanaldaki bozulmalara karşı direnci düşük - ortam gürültülerine karşı ses kalitesini koruyamamakta 18.12.2003 H. Palaz, TÜBİTAK UEKAE 29 NATO Ses Kodlayıcıları STANAG 4198 (1987) – LPC-10e Dar band emniyetli ses sistemleri (NBSVS), Taktik NBSVS, Emniyetli terminal (STU-II), Advanced Narrow Band Digital Voice Terminal (ANDVT) HF (High Frequency) telsizler 18.12.2003 H. Palaz, TÜBİTAK UEKAE 30 NATO Ses Kodlayıcıları STANAG 4479 (1993), – LPC-10 tabanlı model “ Parameters and coding characteristics that must be common to assure interoperability of 800 bps digital speech encoder/decoder” Ses kodlayıcı, parametrik (Vocoder) Frekans atlamalı HF telsizler için tasarlanmıştır + oldukça düşük hız ve dar bant (800 bps) - düşük ses kalitesi - kanaldaki bozulmalara karşı direnci düşük - ortam gürültülerine karşı ses kalitesini koruyamamakta 18.12.2003 H. Palaz, TÜBİTAK UEKAE 31 NATO Ses Kodlayıcıları Orjinal Konuşma ST 4209 CVSD ST 4198 LPC10e Modern FS1016 CELP clean jet10 jet5 heli10 heli5 hmmwv10 hmmwv5 18.12.2003 H. Palaz, TÜBİTAK UEKAE 32 Ses Kodlamadaki Gelişmeler Ses kodlama teknolojisi sürekli olarak gelişmektedir Sinyal işleme camiasında önemli bir çalışma alanı Algoritmalar daha karmaşık hale gelmektedir Daha güçlü DSP’ler geliştirilmekte Donanımlar gerçek zamanda oldukça karmaşık işlemleri yapabilir haldedir Ticari mobil telefon pazarı dar band Kablosuz kanallar (wireless channels) Bu yüzden dar bant ses kodlama büyük ticari ilgi vardır. Yeni ses kodlayıcılar NATO’nunkilerden daha yüksek performanslıdır CELP, RPE-LPC, GSM ‘half-rate’ ses kodlayıcılar ve v.b. 18.12.2003 H. Palaz, TÜBİTAK UEKAE 33 Ses Kodlamadaki Gelişmeler Yeni nesil ses kodlama algoritmaları Servis kalitesinde (QoS) NATO algoritmalarını geçmektedir Arka plan gürültüsü olan ortamlarda, konuşmacının tanınmasında ve ana dilinde konuşmayan konuşmacının anlaşılabilirliğinde daha iyi performans vermektedir Stratejik-taktik şebekelerde ve aralarında uçtan-uça emniyetli kesintisiz (seamless) ses muhabere imkanı tanımaktadır. 18.12.2003 H. Palaz, TÜBİTAK UEKAE 34 Ses Kodlamadaki Gelişmeler Askeri kullanıcılar ses kodlamadaki son gelişmelerin gerisinde kalmıştı ve bu teknolojilerden faydalanamıyordu Birden fazla ses kodlama tekniğinin kullanılması, transcoding CVSD – stratejik, taktik LPC - stratejik, taktik Kalite kaybı Güvenlik zaafiyeti, kırmızı gateway NATO ses kodlayıcılarının taktik ortamlardaki akustik gürültülerdeki ses kaliteleri kabul edilebilir seviyede değildi. Tracked vehicles, Tank Helicopters, Fighter Aircraft Battleship Communication Center, Office and etc. 18.12.2003 H. Palaz, TÜBİTAK UEKAE 35 Ses Kodlayıcı Teknolojisinde Yönelim Hedef Yüksek performans, Düşük hız, değişken hızda çalışabilme Arka plan ve kanal gürültülerine dayanıklı AMR GSM, CDMA-2000, ITU 4kbps Yeni haberleşme sistemleri için 4 kbps civarında yüksek kaliteli (toll quality) (ITU) 18.12.2003 H. Palaz, TÜBİTAK UEKAE 36 Ses Kodlayıcı Teknolojisinde Yönelim G729 (8 Kbps) Female Male G723.1 (6.4 Kbps) G723.1 (5.3 Kbps) SBLPC (4 Kbps) SBLPC (2.4 Kbps) SBLPC (1.2 Kbps) 18.12.2003 H. Palaz, TÜBİTAK UEKAE 37 Ses Kodlayıcı Teknolojisinde Yönelim Askeri uygulamalar da 600, 2400 - 4000 bps Özellikle HF uygulamaları için 600 bps (Harris) Sessiz 2.4kbps 600bps Hmmwv 2.4kbps 600bps 18.12.2003 H. Palaz, TÜBİTAK UEKAE 38 TÜBİTAK UEKAE ULUSAL ELEKTRONİK ve KRİPTOLOJİ ARAŞTIRMA ENSTİTÜSÜ İkinci Bölüm Yeni NATO Ses Kodlama Seçimi (NATO STANAG 4591) Dr. Hasan Palaz Tel: 0 262 648 1369 e-Posta: palaz@uekae.tubitak.gov.tr Aralık 2003 Sunuş Planı NATO Yarışmasının amacı Çalışma Grubu Yarışma Koşulları Aday ses kodlayıcıların teknik gerekleri Yarışma Organizasyonu NATO Yarışmasının Fazları ve Testler (I, II, III) Yarışma Adayları Test Sonuçları STANAG 4591 seçimi Kazanılan deneyimler ve özel sonuçlar Sonuçlar ve diğer bilgiler 18.12.2003 H. Palaz, TÜBİTAK UEKAE 40 Seçimin Amacı NATO’nun 2000’li yıllarda kullanacağı Taktik (TACOM POST-2000), Stratejik ve uydu şebekelerinde kesintisiz kriptolu ses muhaberesini servis kalitesini arttırarak sağlayacak Ses Kodlama Standartının (STANAG) oluşturulması. Birincil Ses Kodlayıcı 2.4 kbps İkincil Ses Kodlayıcı 1.2 kbps Gürültü Giderici 18.12.2003 H. Palaz, TÜBİTAK UEKAE 41 Çalışma Grubu NATO AdHoc Working Group on Narrowband Voice Coding AC322 SC6 AHWG3 Katılımcı Ülkeler 18.12.2003 Türkiye Amerika Almanya Fransa İngiltere Kanada Belçika Hollanda NATO Ajanslıkları Polonya Macaristan H. Palaz, TÜBİTAK UEKAE 42 Yarışma Koşulları NATO üyesi ülkeler aday sunabilmekte Aday sunan ülke adayının test masraflarını karşılayacak. NATO Referans kodlayıcıların test ve ana lab.’ın (NC3A) teçhizat/personelini karşılayacak. AHWG-NBVC tarafından tanımlanmış testler adaylara uygulanacaktır. Bu testler tanımlanırken öncelikle taktik, daha sonra stratejik kullanıcıların servis kalitesinin arttırılması göz önüne alınmaktadır. Seçilecek ses kodlama algoritmasının NATO kullanımında lisans ödemesi olmayacaktır. Toplam sistem maliyeti önemli bir kriterdir. 18.12.2003 H. Palaz, TÜBİTAK UEKAE 43 Yeni STANAG Teknik Gerekleri Birincil hız 2400 bps, ikincil hız 1200 bps Bazı askeri muhabere senaryoları için 2.4 kpbs hızı oldukça yüksektir; örneğin HF radio, UHF satcom gibi. Her iki hız tek kor ses kodlama teknolojisini kullanacaktır. Her iki hız için maksimum gecikme 250 ms’den küçük olacaktır. Seçilecek ses kodlama algoritması kullanılan ve ileride kullanılması planlanan kripto sistemleri ile uyumlu olacaktır. Syn bit kullanımı. Stratejik ve taktik uygulamalarda Servis Kalitesinin arttırılması: 18.12.2003 Ses kalitesi, Anlaşılabilirlik, Ortam ve kanal bozulmalarına karşı gürbüzlük, Haberleşebilirlik, Tandem hassasiyeti, Konuşmacının tanınabilirliği, ve Dil bağımlılığı. H. Palaz, TÜBİTAK UEKAE 44 Yarışma Organizasyonu Yarışma test planın hazırlanmasından AHWG-NBVC sorumlu Test lab.ları TNO, NL, Hollanda CELAR, FR, Fransa ARCON, US, Amerika NC3A, yarışmanın bağımsız ana laboratuarı NC3A, milli laboratuarlara test malzemelerini hazırlayıp yollayacak ve sonuçları toplayacak. Test sonuçların puanlamasını, yorumunu ve yarışma sonucunu AHWGNBVC belirleyecek. Hedeflenen STANAG, AHWG-NBVC tarafından hazırlanacak. 18.12.2003 H. Palaz, TÜBİTAK UEKAE 45 Aday Ses Kodlayıcılar NATO, aday ülkelerin ses kodlayıcı adaylarını sunmalarını istemiştir Üç ülke aday sunmuştur ABD MELP (Mixed Excitation Linear Prediction Fransa HSX (Harmonic Stochastic eXcitation) Türkiye SB-LPC (Split-Band Linear Predictive Coding) 1.2 + 2.4 bps + gürültü giderici 18.12.2003 H. Palaz, TÜBİTAK UEKAE 46 3 Fazlı Test ve Seçim Faz 1 Sınırlı test Sonuçlar geçerleme için kullanılacak Seçimde bir etkisi yok. Faz 2 Detaylı testler Bir çok farklı gürültülü ortam Farklı kalite bileşenlerinin testi Sonuçlar ile seçim yapılacak Faz 3 Gerçek zamanlı haberleşebilirlik testleri Faz 2’deki sonuçların geçerlenmesi 18.12.2003 H. Palaz, TÜBİTAK UEKAE 47 Seçim- 1. Faz Zayıf Adayların Elenmesi Kayan Noktalı Algoritmalar (Floating-Point) Referans Kodlayıcılar LPC10E STANAG 4198, 2.4 kbps CVSD, 16 kbps, CELP, 4.8 kbps Performans Testleri Anlaşılabilirlik (Speech Intelligibility)(US,FR,NL) Ses Kalitesi (Speech Quality)(US,NL) Koşullar Sessiz Oda, 6, 12 dB SNR ve Modern Ofis NC3A, 5488 Mb büyüklüğünde 5848 ses dosyasını işlemiştir 18.12.2003 H. Palaz, TÜBİTAK UEKAE 48 Seçim- 1. Faz Test Ağırlıkları ANLAŞILABİLİRLİK Toplamda Ağırlığı %55 SES KALİTESİ %45 Sessiz Ortam Gürültülü Ortamlar +12dB SNR +6dB SNR Modern Ofis %50 %50 %15 %15 %20 %50 %50 %15 %15 %20 18.12.2003 H. Palaz, TÜBİTAK UEKAE 49 NC3A’de Yapılan İşlemler ANALİZ SENTEZ LPC10e CVSD CELP FR1200 LPC10e B İ T CVSD CELP Dosya FR2400 çıktıları FR2400 Ses TU1200 dosyaları TU2400 8kHz örnekleme, US1200 S US1200 16 bit US2400 İ US2400 18.12.2003 Z İ H. Palaz, TÜBİTAK UEKAE Ses FR1200 Orijinal D İ 9Dokuz 8 7 6 5 4 3 2 1 TU1200 TU2400 Test için test lab.larına gönderilir 50 Çift Karıştırma Ses Dosyaları Dokuz ses çıktı dosyası LPC10e Coder1 Vocoder1 CVSD Coder2 Vocoder2 CELP B Coder3 B Vocoder3 FR1200 L Coder4 L Vocoder4 FR2400 I Coder5 I Vocoder5 TU1200 N Coder6 N Vocoder6 TU2400 D Coder7 D Vocoder7 US1200 Coder8 Vocoder8 US2400 Coder9 Vocoder9 NC3A 18.12.2003 İkinci Karıştırma İlk Karıştırma Test lab. DSTL H. Palaz, TÜBİTAK UEKAE 51 Modulated Noise Reference Unit •MNRU bilinen seviyede gürültü uygulanan bir standarttır.Dinleyiciler bilinen MNRU referansları ile kodlayıcı çıktılarını karşılaştırabilirler. LPC10e CVSD CELP FR1200 FR2400 TU1200 TU2400 US1200 US2400 B İ T D İ Z İ S İ LPC10e CVSD CELP FR1200 FR2400 TU1200 TU2400 US1200 US2400 MNRU 5db Orijinal MNRU 10dB Ses MNRU 15dB dosyası 17 16 Ses dosya 10 17 11 12 13 14 15 çıktısı. MNRU dosyaları test lab.larda ses kalitesinin değerlendirilmesinde referans olarak kullanılacaktır. MNRU 20dB MNRU 25dB MNRU 30dB MNRU 35dB MNRU 40dB 18.12.2003 Dokuz Ses Dosya Çıktıları H. Palaz, TÜBİTAK UEKAE 52 Seçim- 2. Faz Seçimin Gövdesini Oluşturan Faz Sabit Noktalı Algoritmalar (Fixed-Point) Performans Testleri Anlaşılabilirlik (Speech Intelligibility)(US,FR,NL) Ses Kalitesi (Speech Quality)(US,NL) Konuşanın Tanınabilirliği (Speaker Recognizability)(US,NL) Dil Bağımlılığı (Language Dependency)(NL) Koşullar (10 adet akustik ortam) Sessiz Oda 18.12.2003 H. Palaz, TÜBİTAK UEKAE 53 Seçim- 2. Faz Modern Arazi Kumanda Şelteri Jeep - P4 ve HMMWV M2/M19 Tank - Leclerc Silahlı Personel Taşıyıcı -M2 Bradley Helikopter - UH60 Black Hawk Savaş Uçağı - F16(F15), Rafale Otomobil - Volvo %1 Random bit error CVSD Kodlayıcı ile Tandem Bağlantı Ofis ve 6, 12 dB SNR 18.12.2003 H. Palaz, TÜBİTAK UEKAE 54 Seçim- 2. Faz Test Ağırlıkları ANLŞ Toplamda Ağırlığı Sessiz Ortam Gürültülü Ortamlar Rastgele bit Hataları Tandem, CVSD Fısıltılı Ses 18.12.2003 %45 %26 %54 %7 %8 %5 SES KLT KNŞ. TNLĞ. DİL BAĞ. %35 %40 %50 %5 %5 H. Palaz, TÜBİTAK UEKAE %10 %35 %65 %10 %100 55 2. Faz Gürültülü Ortam Test Ağırlıkları Toplamda Ağırlığı +12dB SNR +6dB SNR Modern Ofis Arazi Kumanda Şelteri HMMWV Fransız Jipi(P4) Fransız Tankı (Leclerc) M2A2 Bradley Vehicle Helikopter - Black Hawk Savaş Uçağı - F15 Savaş Uçağı – Rafale Volvo-Komutan Aracı 18.12.2003 ANLŞ %54 %6 %6 %6 %6 %3 %3 %3 %3 %6 %3 %3 %6 SES KLT %50 %7 %5 %10 %8 %5 H. Palaz, TÜBİTAK UEKAE KNŞ TNLĞ %65 %65 %5 %10 56 Seçim- 2. Faz Ek Testler 1% rasgele bit hatası Giriş ses dosyası Bit dizisi Kodlayıcı n Test : 1% Bit hata oranı B Giriş ses dosyası Sentez n Çıkış ses dosyası CVSD Kodlayıcı i t s CVSD sentez A u d i o B i Kodlayıcı n t s Sentez n Çıkış ses dosyası Test : Tandem Ses kodlayıcı 18.12.2003 H. Palaz, TÜBİTAK UEKAE 57 Seçim- 2. Faz Test Malzemeleri 3 test lab. x 9 adet kodlayıcı (+ 8 MNRU seviyesi) x ≤ 5 test x ≤ 12 gürültülü test durumu x ≤ 88 her bir testdeki dosya sayısı 28,000 den fazla dosya 13 GB dan fazla işlenmiş ses verisi ≅ 200 saatlik ses verisi Bu test sonuçları nasıl birleştirilecek? 18.12.2003 H. Palaz, TÜBİTAK UEKAE 58 Niçin Precision Weighted Ranking kullanıldı Quiet Üç farklı lab. Tarafından yapılmış olan anlaşılabilirlik testleri arasındaki farklar Genel yönelim aynı gibi....? Puanlar farklıdır 100.0 95.0 90.0 85.0 80.0 Arcon 75.0 CELAR 70.0 TNO 65.0 60.0 55.0 50.0 1 US24 2 CELP 3 FR24 4 5 6 CVSD TU24 US12 7 LPC 8 TU12 9 FR12 BlackHawk 90.0 80.0 Bütün sonuçların doğru olarak birleştirilmesine ihtiyaç vardır Basit bir ölçekleme yeterli değildir. 18.12.2003 70.0 60.0 Arcon 50.0 CELAR 40.0 TNO 30.0 20.0 10.0 0.0 1 US24 2 CELP 3 FR24 4 5 CVSD TU24 H. Palaz, TÜBİTAK UEKAE 6 US12 7 LPC 8 9 TU12 FR12 59 Precision Weighted Ranking 1 Test sonuçları parçacıklara veya bin’lere bölünür Test hassasiyeti (resolution or 95% confidence interval) bin uzunluğudur Kodlayıcının puanı, test sonucunun içinde bulunduğu bin değeridir 18.12.2003 Confidence interval of test Bin 1 0.26 Score vs Interval Bin 3 Bin 4 Confidence interval of test Bin 5 Bin 7 y = 0.0341x + 0.1949 c 0.22 0.18 0.20 0.40 0.60 H. Palaz, TÜBİTAK UEKAE 0.80 1.00 1.20 1.40 1.60 60 Precision Weighted Ranking 2 Score vs Interval Confidence interval of test Bin 1 Kodlayıcının puanı, test sonucunun içinde bulunduğu bin değeridir En kötü kodlayıcının puanı her zaman 1’dir. Bu test örneğinde Vocoder 7 en düşük puandadır Vocoder 4, 5 and 2’nın test sonuçları 7. Aralıkta olduğundan, puanları 7’dir Bütün bu test puanları ağırlık matrisine yerleştirilir. 18.12.2003 0.26 Bin 3 Bin 4 Confidence interval of test Bin 5 Bin 7 y = 0.0341x + 0.1949 c 0.22 0.18 0.20 0.40 1 0.2238 0.4263 V7 0.60 2 0.4263 0.6357 Score = 1 0.80 1.00 1.20 1.40 3 4 5 6 0.6357 0.8522 1.0762 1.3077 0.8522 1.0762 1.3077 1.5472 1.60 7 1.5472 1.7948 V8 V6 V9 V3 V1 V4 V5 Score V2 H. Palaz, TÜBİTAK UEKAE =7 61 Ağırlık Matrisi Coder Wgt. 2400bps 1200bps 60% 40% Performa nce Characte ristic Wgt. Intelligibility 41.8% Whispered Spe Quality 2.2% 34.2% Test Method Wgt. DRT(US) CVC(NL) Inteltrans(FR NA NA NA SRT(NL) MOS(US) MOS(NL) NA NA NA Type Conditio n Wgt. Baseline 27.4% coustic Nois 56.8% Transmis sion. Channel 7.4% Tandem 8.4% TOTAL 100.0% Special 100.0% TOTAL Baseline Acoustic Nois Quality BER 18.12.2003 1.8% MOS(NL) NA 100.0% 42.1% 52.6% Tandem 5.3% TOTAL Transmis sion. Channel 100.0% TOTAL 100.0% 100.0% Conditio n Quiet TOTAL SNR(12) SNR(6) Office MCE Field Shelter HMMMW V or P4 M2A2 Bradley or Leclerc UH60 Black Hawk F15 or Mirage2000 Volvo TOTAL Random Bit Errors (1%) TOTAL VSD=>Cod TOTAL CHECK Whispere d Speech TOTAL CHECK Quiet TOTAL SNR(12) SNR(6) Office MCE Field Shelter HMMMW V F15 Volvo TOTAL VSD=>Cod TOTAL CHECK Transmis sion. Channel TOTAL CHECK H. Palaz, TÜBİTAK UEKAE Cond. by Cond. by Type by Type by Char. by Char. by 2.4 1.2 Coder Coder 6.86% 4.58% Cond. by Type Cond. by Type by Char. 100.0% 100.0% 11.1% 11.1% 11.1% 27.4% 11.44% 6.3% 6.3% 6.3% 2.64% 2.64% 2.64% 1.58% 1.58% 1.58% 1.06% 1.06% 1.06% 11.1% 6.3% 2.64% 1.58% 1.06% 11.1% 6.3% 2.64% 1.58% 1.06% 11.1% 6.3% 2.64% 1.58% 1.06% 11.1% 6.3% 2.64% 1.58% 1.06% 11.1% 6.3% 2.64% 1.58% 1.06% 11.1% 100.0% 6.3% 2.64% 1.58% 1.06% 100.0% 7.4% 3.08% 1.85% 1.23% Wgt. 100.0% 100.0% 100.0% 800.0% 8.4% 3.52% 2.11% 1.41% 100.0% 41.80% 25.08% 16.72% 100.0% 100.0% 2.20% 1.32% 0.88% 100.0% 42.1% 2.20% 14.40% 1.32% 8.64% 0.88% 5.76% 7.4% 5.3% 10.5% 2.52% 1.80% 3.60% 1.51% 1.08% 2.16% 1.01% 0.72% 1.44% 8.4% 2.88% 1.73% 1.15% 100.0% 200.0% 100.0% 100.0% 14.0% 10.0% 20.0% 16.0% 10.0% 5.3% 1.80% 1.08% 0.72% 10.0% 20.0% 100.0% 100.0% 100.0% 600.0% 5.3% 10.5% 1.80% 3.60% 1.08% 2.16% 0.72% 1.44% 5.3% 1.80% 1.08% 0.72% 100.0% 34.20% 20.52% 13.68% 100.0% 100.0% 1.80% 1.08% 0.72% 100.0% 200.0% 100.0% 1.80% 1.08% 0.72% 62 Faz 1 – Anlaşılabilirlik 100.00 80.00 60.00 6 dB 40.00 12 dB 20.00 Office Clear Clear 6 dB US2400 TU2400 FR2400 US1200 TU1200 FR1200 CELP CVSD LPC10 0.00 ARCON Anlaşılabilirlik (DRT) Sonuçları 18.12.2003 H. Palaz, TÜBİTAK UEKAE 63 Faz 1 – Ses Kalitesi 4.00 3.50 3.00 2.50 2.00 Babble 6dB 1.50 Babble 12dB 1.00 Office Quiet 0.50 US1200 Babble 6dB TU1200 FR1200 US2400 TU2400 FR2400 LPC10 Office CVSD CELP 0.00 ARCON Ses Kalite (MOS) Sonuçları 18.12.2003 H. Palaz, TÜBİTAK UEKAE 64 Faz 2 – Anlaşılabilirlik ARCON DRT Kodlayıcıların bütün gürültülü ortamlardaki anlaşılabilirlik (DRT) test sonuçları Intelligibility score (%) 95.0 90.0 85.0 Quiet 80.0 6dB Babble 12dB Babble 75.0 Tandem 70.0 BER 65.0 60.0 55.0 1 2 3 4 5 US24 CELP FR24 CVSD TU24 6 US12 7 LPC 8 9 TU12 FR12 ARCON DRT 95.0 Intelligibility score (%) 90.0 85.0 Office 80.0 MCE 75.0 HMMWV 70.0 Bradley 65.0 Black Haw k 60.0 F15 55.0 Auto 50.0 45.0 1 2 3 4 5 US24 CELP FR24 CVSD TU24 18.12.2003 H. Palaz, TÜBİTAK UEKAE 6 US12 7 LPC 8 TU12 9 FR12 65 Faz 2 – Ses Kalitesi ARCON MOS MOS puanları 1 (Bad) 2 (Poor) 3 (Fair) 4 (Good) 5 (Excellent) Mean Opinion Score 4.0 3.5 3.0 Quiet 6dB Babble 2.5 12dB Babble Tandem 2.0 1.5 1.0 1 2 3 4 5 6 7 US24 CELP FR24 CVSD TU24 US12 LPC 8 9 TU12 FR12 ARCON MOS Kodlayıcıların bütün koşullardaki ses kalite (MOS test) sonuçları 4.0 Mean Opinion Score 3.5 Office MCE 3.0 HMMWV 2.5 Bradley Black Haw k 2.0 F15 Auto 1.5 1.0 18.12.2003 US24 CELP FR24 CVSD TU24 US12 LPC 1 2 3 4 5 6 7 H. Palaz, TÜBİTAK UEKAE TU12 FR12 8 9 66 Dil Bağımlılığı Dil bağımlılığı test sonuçları X ekseninden uzaklaştıkça daha bağımlı Testin hassasiyeti çok düşük, dağılımlar birbiri üzerinde ve sonuçlarda bir ayırım söz konusu değil. Anlamlı bir test olmadığı görüldü. 18.12.2003 Language Dependency 0.6000 0.4000 0.2000 0.0000 -0.2000 V1 V2 V3 V4 V5 V6 V7 V8 V9 -0.4000 TNO -0.6000 -0.8000 -1.0000 -1.2000 -1.4000 -1.6000 US24 CELP FR24 CVSD TU24 H. Palaz, TÜBİTAK UEKAE US12 LPC TU12 FR12 67 Faz 1- Faz 2 Gelişim Intelligibility 95.00 90.00 DRT Score Milli adayımız (SBLPC) faz-I testleri için teslim edilmeden önce detaylı testlere tabi tutulamamıştır. Gerekli milli lab. yoktu. Faz 1’de alınan sonuçlar doğrultusunda 1,5 aylık yoğun çalışma yapılarak, görülen eksiklikler giderilmiştir. Faz 2’de sabit noktalı C olmasına rağmen daha yüksek dereceler alınmıştır. Phase I Quiet 85.00 PII Quiet 80.00 75.00 70.00 US2400 CELP FR2400 CVSD TU2400 US1200 LPC10 TU1200 FR1200 Coders Quality 2.40 2.20 2.00 DRT Score 100.00 Phase I 6dB Babble 1.80 PII 6dB Babble 1.60 1.40 1.20 1.00 US2400 18.12.2003 CELP FR2400 H. Palaz, TÜBİTAK UEKAE CVSD TU2400 Coders US1200 LPC10 TU1200 FR1200 68 Faz 2 Eksikler Quiet SB-LPC, özellikle TNO tarafından yapılan Hollandaca (Dutch) testlerinden düşük puan almıştır. Bu durum Hollandaca yapılan bütün testlerde aynıdır. SBLPC’nin eğitiminde kullanılan ses veritabanının küçük olmasından kaynaklanmıştır. 18.12.2003 4.50 4.00 3.50 Arcon TNO 3.00 2.50 2.00 1 US24 2 CELP 3 4 5 6 FR24 CVSD TU24 US12 H. Palaz, TÜBİTAK UEKAE 7 LPC 8 9 TU12 FR12 69 Faz 2 Birleştirilmiş Sonuçlar 10 9 8 7 6 5 4 3 2 1 0 18.12.2003 H. Palaz, TÜBİTAK UEKAE 70 Faz 2 Birleştirilmiş Sonuçlar 9 8 7 6 5 4 3 2 1 0 •2400 ve 1200 bps sonuçları birleştirilerek, seçim yapılmıştır • 60% - 2400 bps • 40% - 1200 bps 18.12.2003 H. Palaz, TÜBİTAK UEKAE 71 Faz 2 Sonuç Detaylı ve geniş testlerden sonra 24 October 2001 Paris/Fransa Kodlayıcı C STANAG 4591 olarak seçildi Kodlayıcı C = ABD Adayı, MELPe 1996 2.4kbps MELP ABD ulusal standartı NATO’da çalışmalar ABD liderliğinde 1997’de başladı TI, AT&T ve Microsoft (SignalCom) ortak çalışma MELPe hazırlandı, 1.2kbps+2.4kbps+npp Çalışmalar JTRS projesinin altında desteklendi Düzenli ve sürekli çalışmanın başarısı 18.12.2003 H. Palaz, TÜBİTAK UEKAE 72 MELPe Ses Örnekleri original NPP 2.4kb/s MELP DoD4.8 CELP clean jet10 jet5 heli10 heli5 hmmwv10 hmmwv5 18.12.2003 H. Palaz, TÜBİTAK UEKAE 73 Seçim- 3. Faz II. Fazın en iyi iki adayı arasından seçim??? Gerçek Muhabere Ortamında Testler Yapılacak Gerçek Zamanda Sabit Noktalı Gerçekleme ve Test Sistemine Arayüz Performans Testleri Haberleşme Verimliliği (Communicability)(CA) Anlaşılabilirlik (Speech Intelligibility)(US,FR,NL) Ses Kalitesi (Speech Quality)(US,NL) Koşullar Taktik Sahadaki Temel Muhabere Senaryoları 18.12.2003 H. Palaz, TÜBİTAK UEKAE 74 Seçim- 3. Faz Test Senaryoları 1.2kbps HF Ortamı, Hmmwv-Mce 1 VHF Ortamı, Apc-BlackH. 0 Taktik Uydu Ortamı, F-16-Mce 1 UHF Ortamı, F16-E3A 0 Stratejik Uydu Ortamı 2 aircraft carrier--modern office E3A--modern office 18.12.2003 H. Palaz, TÜBİTAK UEKAE 2.4kbps 0 1 1 1 2 Ref. Coder (STNG 4479) (STNG 4198) (4198, 4479) (STNG 4198) (4198, 4479) 75 SC6 AHWG3 Güncel Çalışmaları Faz 3 Testi Faz 2’yi kazanan MELPe’nin gerçek zaman gerçeklemesi Haberleşebilirlik testleri Gerçek hayat muhabere senaryosu ve problemleri Uçtan uca gecikme etkisi STANAG 4591’in hazırlanıp SC6’ya sunulması STANAG 4591’in tanıtımı ve uygulama alanlarının genişletilmesi 18.12.2003 H. Palaz, TÜBİTAK UEKAE 76 Sonuçlar NATO seçiminde başarılı olarak ABD ve FR ile yarışılmıştır. İstenen sonucun alınamaması Geriden takip etme, 1998’de çalışmaya başlama Test lab. Altyapısının olmaması 18.12.2003 Büyük haberleşme projelerinin altında ses kodlama ve işleme çalışmalarının desteklenmesi. H. Palaz, TÜBİTAK UEKAE 77 Kazanılan deneyimler ve özel sonuçlar Teknik olarak güçlü olunca...... Dışlanma girişimi, koordinasyon, destek Mücadele etmek..... Aktif mücadele, kuralları iyi bilme ve kullanma NATO imkanlarının iyi kullanılması Bilgi paylaşımı, potansiyel Pazar, ekonomik çıkar Mutlaka Uluslar arası pazara açılmalıyız Özgün teknoloji, modern pazarlama, ihtiyaçların modern tekniklerle belirlenmesi 18.12.2003 H. Palaz, TÜBİTAK UEKAE 78 Detaylı Bilgi STANAG 4591 test and selection process NATO ses kodlama yarışması (ARGE 99-1) projesi bitiş raporu, TÜBİTAK-UEKAE, SSM’ye sunuldu, 25/04/2002. NATO Voice Coding Workshop, FEL-TNO, The Hague, 18 October 2002. Introduction to military voice coding, NATO C3 Agency Technical Presentation-005. Introduction to military voice coding, NATO C3 Agency Technical Presentation-001. “Future NATO narrow band voice coder selection: Stanag 4591 (phase 1)”, NC3A Technical Note 881, The Hague, December 2001 “Future NATO narrow band voice coder selection: Stanag 4591 (phase 2)”, NC3A Technical Note 912, The Hague, February 2002 Street MD and Collura JS, “Interoperable Voice Communications: test and selection of STANAG 4591”, RTA IST Symposium NATO Research and Technology Agency (Information Systems and Technology panel) Tactical Military Communications symposium, Warsaw, October 2001 Street MD and Collura JS, “The test and selection of the future NATO narrow band voice coder”, RCMCIS - NATO Regional Conference on Military CIS, Warsaw, Zegrze, October 2001. Street MD, “Host laboratory role in the selection of the future NATO narrow band voice coder”, Speech Processing Workshop, Japan, October 2002. http://nc3a.info/Voice http://S4591.nc3a.nato.int/ http://www.iee.org/OnComms/pn/communications/library.cfm#VoiceCoders 18.12.2003 H. Palaz, TÜBİTAK UEKAE 79 Teşekkürler NATO Yarışma Projesinin Paydaşları Gen.Kur. MEBS Başkanlığı, MSB-SSM ARGE şubesi, TÜBİTAK-UEKAE, Surrey Unv.-CCSR Araştırma Merkezi, NATO Türk Askeri Temsilciliği ve Dışişleri Delegasyonu Proje Ekibi. 18.12.2003 H. Palaz, TÜBİTAK UEKAE 80 Sorular 18.12.2003 H. Palaz, TÜBİTAK UEKAE 81