Hierarchical support vector classifier with an application to diabetes control.
Master's thesis
مكان النشر
Sultan Qaboos University
نوع الرسالة الجامعية
Master's thesis
الملخص الإنجليزي
This study explored the statistical classification problem, which dates back
to the solution provided by the Fisher’s linear discriminant function. Multivariate discriminant models sometimes fail to achieve reasonable accuracy, especially
when observations in some classes are difficult to be correctly classified. Todate, high prediction accuracy models are being sought upon, mainly for the
non-separable problem. The support vector models have become more efficient
as compared to the parametric models, in the last three decades, because of their
robustness as they work through determining optimal linear hyperplanes. However, these models, which are used both for classification and regression are at
times identified with significantly low levels of efficiency, requiring use of Kernels. Moreover, correct classification of patients with diabetes based on glycated
haemoglobin (HbA1c) is an important indicator of blood glucose control and is a
key requirement for level of management and medicinal intake compliance among
patients diagnosed with diabetes. Thus, the need for models that account for
the important associated demographic and related factors, which affect efficiency
of diabetes control among patients. This study sought to achieve two-pronged
aim, that is, to improve the performance of the support vector models by proposing hierarchical-based modelling and to predict diabetes’ disease control among
patients using various datasets. The proposed hierarchical support vector machine (hSVM) and hierarchical support vector regression (hSVR) were based on
the foundation of stratification and validated against the classical SVM through
compairing the correct classification rates and mean square errors. Findings from
the experimental studies all show that the modified hSVM and hSVR models
significantly improve the correct classification rates across various data scenarios
and minimize the mean square errors, respectively. Moreover, there are other
advantages associated with proposed hSVM/hSVR such as scalability to large
sample, besides giving detailed strata-based statistical analyses.
الملخص العربي
تناولت هذه الدراسة مشكلة التصنيف الاحصائي، والتي تعود إلى الحل الذي قدمته دالة التمييز الخطي لفيشر. تفشل النماذج التمييزية متعددة المتغيرات في بعض الاحيان في تحقيق دقة معقولة فالتصنيف، خاصة عندما يكون من الصعب تصنيف المالحظات في بعض الفئات بشكل صحيح. حتى الان، يتم البحث عن نماذج ذات دقة تنبؤ عالية، وذلك أسا ًسا للمشكلة غير القابلة للفصل. لقد أصبحت نماذج المتجهات الداعمة أكثر كفاءة مقارنة بالنماذج الاحصائية الكالسيكية في العقود الثالثة الماضية، وذلك بسبب متانتها أثناء عملها من خالل تحديد المستويات الخطية الفائقة الامثل. وم ع ذلك، فإن هذه النماذج، التي تستخدم للتصنيف والانحدار، يتم تحديدها في بعض الاحيان بمستويات منخفضة ج ًدا من الكفاءة، مما يتطلب استخدام النواة. عالوة على ذلك، يعد التصنيف الصحيح للمرضى المصابين بداء السكري على ( مؤش ًر حكم في نسبة الجلوكوز في الدم ا مه ًم أساس الهيموجلوبين السكري )c1HbA ا للت وهو متطلب أساسي لمستوى الادارة والامتثال لتناول الادوية بين المرضى الذين تم تشخيص إصابتهم بمرض السكري. ومن هنا تبرز الحاجة إلى نماذج تراعي العوامل الديموغرافية والعوامل ذات الصلة المهمة المرتبطة بها، والتي تؤثر على كفاءة السيطرة على مرض السكري بين المرضى. سعت هذه الدراسة إلى تحقيق هدف ذي شقين، وهو تحسين أداء نماذج ناقالت الدعم من خالل اقتراح النمذجة القائمة على التسلسل الهرمي والتنبؤ بالسيطرة على مرض السكري بين المرضى باستخدام مجموعات البيانات المختلفة. استندت آلة ناقل الدعم الهرمي المقترحة )hSVM )وانحدار ناقل الدعم الهرمي )hSVR )إلى أساس التقسيم الطبقي وتم التحقق من صحتها مقارنة بتماذج التصنيف الكالسيكي من خالل مقارنة معدالت التصنيف الصحيحة والاخطاء المربعة المتوسطة. تظهر جميع نتائج الدراسات التجريبية أن نماذج التصنيف المعدلة تعمل على تحسين معدالت التصنيف الصحيحة بشكل كبير عبر سيناريوهات البيانات المختلفة وتقليل متوسط الاخطاء المربعة، على التوالي. عالوة على ذلك، هناك مزايا أخرى مرتبطة بـنماذج التصنيف الهرمية المقترحة مثل قابلية التوسع لعينة كبيرة، إلى جانب تقديم تحليالت إحصائية مفصلة قائمة على الطبقات.
قالب العنصر
الرسائل والأطروحات الجامعية