وثيقة

Predictive ensemble model for early diagnosis of diabetes using Sultan Qaboos University Hospital Dataset.

مؤلف
عناوين أخرى
نموذج أساسي تنبؤي للتشخيص المبكر لمرض السكري باستخدام مجموعة بيانات مستشفى جامعة السلطان قابوس
الناشر
Sultan Qaboos University.
ميلادي
2022
اللغة
الأنجليزية
الملخص الإنجليزي
Diabetes Mellitus is a public health challenge with social and economic consequences for nations irrespective of their economic stability. The Ministry of Health reports that diabetes is on the rise for Omanis and has increased to the extent that it is the second ranked most prevalent disease among non-communicable diseases, a significant cause of health loss condition in Oman. Despite this, diabetes is preventable by accepting a healthier lifestyle. Thus, an appropriate tool for prognosis can assist the doctors in detecting the disease early and recommending the necessary lifestyle changes to reduce its progress. Information overloaded to the Clinic and health care centres for the patients that require sophisticated analysis tools and techniques to extract valuable knowledge and transform them into understandable patterns for decision-making. The latest data mining techniques, including ensemble algorithms, can be applied to significantly obtain the hidden patterns from the voluminous dataset to improve the diagnosis of diabetes at the initial stage of pre-diabetes. This research aims to construct a predictive ensemble model that can significantly classify and predict diabetes at the earliest stage accurately using the dataset collected from the Sultan Qaboos University Hospital database from Jan 2019 to October 2021. The ensemble model overcomes the variance problem of individual algorithms by combining the prediction results from different algorithms to create strong prediction results. The study applied five supervised classification algorithms to build the Stacking and Voting ensemble models, including Random Forest (RF), Decision Tree (J48), K-Nearest Neighbours (KNN), Support Vector Machine (SVM), and Naïve Bayes (NB). These algorithms were evaluated using different performance evaluation metrics, including recall, accuracy, AUC curve and precision, and validated using the cross-validations process to overcome the bias of the individual algorithms. The outperform algorithm is then used to demonstrate the utilisation of the model and discover the hidden knowledge in the dataset. The study outcomes confirm that accuracy achieved by the ensemble algorithms, including stacking, and voting models, produce promising results compared to other techniques for learning from complex datasets due to combining different prediction results from the individual algorithms. Because the stacking algorithm combines the correct prediction results from the individual classifiers, it provides the most accurate results of 86.9% and an AUC curve of 86.9% in predicting diabetes. Therefore, it can be used as an automatic prognostic tool to improve the diagnosis system in healthcare. However, it can be optimised further to progress prediction accuracy by including the significant risk factors in predicting diabetes. An improved diabetes diagnosis system using machine learning methodologies results in the awareness and accelerating decision-making that may help physicians and doctors understand the disease better and enhance proper treatment. Consequently, it reduces hospitalisations, improves clinical outcomes, and minimises health expenditure for government and individuals.
الملخص العربي
داء السكري هو أحد تحديات الصحة العامة وله آثار اجتماعية ومالية على الدول بغض النظر عن وضعها الاقتصادي. وبحسب وزارة الصحة ، فقد ارتفع معدل انتشار مرض السكري بين العمانيين إلى درجة أنه يحتل المرتبة الثانية بين الامراض غير المعدية ، وهو سبب مهم لفقدان الصحة في عمان. على الرغم من ذلك ، يمكن الوقاية من مرض السكري إلى حد كبير من خلال اتباع أسلوب حياة أكثر صحة. وبالتالي ، يمكن ألداة التشخيص المناسبة أن تساعد الاطباء في اكتشاف المرض مبكًرا والتوصية بالتغييرات الضرورية في نمط الحياة لتقليل تقدمه. المعلومات المثقلة بالعيادة ومراكز الر عاية الصحية للمرضى والتي تتطلب أدوات وتقنيات تحليل متطورة الستخراج المعرفة القيمة وتحويلها إلى أنماط مفهومة التخاذ القرار.يمكن تطبيق أحدث تقنيات استخراج البيانات ، بما في ذلك خوارزميات المجموعات ، للحصول بشكل كبير على الانماط المخفية من مجموعة البيانات الضخمة لتحسين تشخيص مرض السكري في المرحلة الاولى من مرحلة ما قبل السكري. يهدف هذا البحث إلى بناء نموذج تجميع تنبؤي يمكنه تصنيف مرض السكري والتنبؤ به بشكل كبير في المرحلة الاولى بدقة باستخدام مجموعة البيانات التي تم جمعها من قاعدة بيانات مستشفى جامعة السلطان قابوس في الفترة من يناير 2019 إلى أكتوبر .2021 يتغلب نموذج المجموعة على مشكلة التباين في الخوارزميات الفردية من خلال الجمع بين نتائج التنبؤ من خوارزميات مختلفة لخلق نتائج تنبؤ قوية. طبقت الدراسة خمس خوارزميات تصنيف خاضعة لإلشراف لبناء نماذج وآلة (KNN (Neighbours Nearest-K) 48J (مجموعات التكديس والتصويت ، بما في ذلك شجرة القرار تم تقييم هذه الخوارزميات .(NB (Bayes Naïve و (RF (والغابة العشوائية (SVM (المتجهات الداعمة والتحقق من صحتها باستخدام AUC باستخدام مقاييس مختلفة لتقييم الاداء مثل الدقة والدقة والاسترجاع ومنحنى عملية التحقق من الصحة للتغلب على تحيز الخوارزميات الفردية. ثم يتم استخدام خوارزمية الاداء المتفوق لتوضيح استخدام النموذج واكتشاف المعرفة المخفية في مجموعة البيانات.تؤكد نتائج الدراسة أن الدقة التي حققتها خوارزميات المجموعة ، بما في ذلك نماذج التكديس والتصويت ، تنتج نتائج واعدة مقارنة بالتقنيات الاخرى للتعلم من مجموعات البيانات المعقدة بسبب الجمع بين نتائج التنبؤ المختلفة من الخوارزميات الفردية. نظ ًرا ألن خوارزمية التكديس تجمع بين نتائج التنبؤ الصحيحة من المصنفات الفردية ، فإنها توفر أكثر النتائج دقة بنسبة ٪86.9 ومنحنى الجامعة الامريكية بالقاهرة بنسبة ٪86.9 في التنبؤ بمرض السكري. لذلك ، يمكن استخدامه كأداة تشخيصية تلقائية لتحسين نظام التشخيص في الرعاية الصحية. ومع ذلك ، يمكن تحسينه بشكل أكبر لإحراز تقدم في دقة التنبؤ من خلال تضمين عوامل الخطر المهمة في التنبؤ بمرض السكري. يؤدي تحسين نظام تشخيص مرض السكري باستخدام منهجيات التعلم الالي إلى زيادة الوعي وتسريع عملية اتخاذ القرار التي قد تساعد الاطباء والاطباء على فهم المرض بشكل أفضل وتعزيز العالج المناسب. وبالتالي ، فإنه يقلل من دخول المستشفى ، ويحسن النتائج .السريرية ، ويقلل الانفاق الصحي للحكومة والافراد.
قالب العنصر
الرسائل والأطروحات الجامعية