Document
Voice-based biometric
Other titles
text-independent speaker identification system
Publisher
Sultan Qaboos University
Gregorian
2008
Language
English
English abstract
Biometrics refers to the automatic identification of a person based on his/her physiological or behavioural characteristics. By replacing passwords, biometric SSW techniques can potentially prevent unauthorized access to use of ATMs, cellular phones, desktop PCs and computer networks. Various types of biometric systems are being used for real-time identification among them, fingerprint matching, face recognition and voice recognition.
Speaker recognition, which is based on voice recognition, is a very interesting research area that has developed well over the years. A speaker recognition system typically consists of two main parts: feature-set extraction and pattern matching. There are several known feature sets for text-independent speaker identification systems, most of which are dependent on spectral information. Among these feature sets and one of the most successful is the Mel-Frequency Cepstrum Coefficients (MFCC). This thesis introduces a new feature set (Histogram of DCT-Cepstrum Coefficients) inspired by the MFCC, but simpler and faster in computation. A text independent speaker identification system based on DCT-Cepstrum Histogram and Gaussian Mixture Model (GMM) is implemented. The testing of the new feature was done using speech files from the ELSDSR database and TIMIT corpus. The new feature set managed to achieve high efficiency rates with identification accuracy of 100% on 23 speakers from the ELSDSR database, and 99% on 630 speakers from the TIMIT corpus.
Member of
Resource URL
Arabic abstract
القياس الحيوي ينسب إلى التعرف الآلي على الشخص معتمدا على المميزات الفيزيائية أو المميزات السلوكية. تقنيات القياس الحيوي تمكن من استبدال كلمات المرور للحد من عمليات الدخول غير المصرح الأنظمة البنوك و أجهزة الهاتف الخلوي و الحواسيب الآلية و الشبكات. حاليا هناك عدد من أنظمة القياس الحيوي المستعملة في التعرف على الشخص منها قراءة البصمة و التعرف من خلال الوجه و التعرف من خلال الصوت التعرف على المتحدث الذي يعتمد على التعرف من خلال الصوت يعتبر من المجالات التي تطورت بشكل ملفت على مر السنوات. نظام التعرف على المتحدث يحتوي عادة على قسمين أساسيين: استخلاص المميزات و توافق الأنماط ويوجد حاليا عدة طرق لاستخلاص المميزات حيث أن معظمها يعتمد على المعلومات الطيفية. الMFCC يعتبر من إحدى انجح الطرق في استخلاص المميزات
هذا البحث يقدم طريقة جديدة في استخلاص المميزات و يسمى بال DCT - Cepstrum Histogram. وهذه الطريقة قد طورت معتمدة على الهام الMFCC ولكن الطريقة الجديدة تعتبر أسهل و أسرع من الMFCC. حيث استطعنا في هذا البحث تطبيق نظام التعرف على المتحدث معتمدا على ال-DCT Cepstrum Histogram و الGMM. والنظام المطبق اختبر باستعمال ملفات صوتية من الELSDSR و الTIMIT. الطريقة الجديدة التي طورت استطاعت أن تحقق نتائج ممتازة حيث نجحت في الحصول على كفاءة %100 في تصنيف 23 متحدثا من الELSDSR و ايضا الحصول على كفاءة %99 في تصنيف 630 متحدثا من الTIMIT.
هذا البحث يقدم طريقة جديدة في استخلاص المميزات و يسمى بال DCT - Cepstrum Histogram. وهذه الطريقة قد طورت معتمدة على الهام الMFCC ولكن الطريقة الجديدة تعتبر أسهل و أسرع من الMFCC. حيث استطعنا في هذا البحث تطبيق نظام التعرف على المتحدث معتمدا على ال-DCT Cepstrum Histogram و الGMM. والنظام المطبق اختبر باستعمال ملفات صوتية من الELSDSR و الTIMIT. الطريقة الجديدة التي طورت استطاعت أن تحقق نتائج ممتازة حيث نجحت في الحصول على كفاءة %100 في تصنيف 23 متحدثا من الELSDSR و ايضا الحصول على كفاءة %99 في تصنيف 630 متحدثا من الTIMIT.
Category
Theses and Dissertations