Document

Machine-learning-based breast cancer detection and survival prediction using complete blood count information.

Identifier
Al-Azriyah, Alshima Salim Hilal (2020). Machine-learning-based breast cancer detection and survival prediction using complete blood count information. (Master thesis. Sultan Qaboos University, Muscat, Oman).
Publisher
Sultan Qaboos University.
Gregorian
2020
Language
English
English abstract
This work is about breast cancer which is one of the main causes of mortality in women. Early detection remains very crucial to improve survival among breast cancer patients. In this project two main topics are investigated. The first one is related to the automatic detection of breast cancer using complete blood count (CBC). The second one deals with the prediction of survival among breast cancer patients. Both detection and prediction go through two stages, namely feature selection and classification. Different techniques are used for feature selection. These techniques belong to either the filter approach or the wrapper approach. In the classification stage, number of machine learning algorithms are used to classify the data in to two classes, namely cancer and cancer-free for detection version and survive and die for survival prediction version. Last stage is to evaluate the evaluation metrics like: accuracy, sensitivity, specificity and area under the curve (AUC). In the breast cancer detection CBC results at first entry to the clinic give better evaluation metric with 78.8% accuracy and AUC equal to 0.89. On the other hand, in survival prediction, CBC at the diagnosis date gives better evaluation metrics with 90.5% accuracy and 0.93 for AUC. The algorithms are evaluated using CBC data collected and labelled by experts from Sultan Qaboos University Hospital.
Arabic abstract
هذا العمل يتحدث عن سرطان الثدي والذي يسبب العدد األكبر من الوفيات. التشخيص المبكر لهذا المرض هو عامل أساسي
لتحسين فرصة النجاة للمريض. في هذا المشروع لدينا جزأين أساسيين: الجزء األول عن تشخيص سرطان الثدي باستخدام
خصائص مستخرجة من فحص الدم الشامل. الجزء الثاني يناقش التنبؤ بحياة مريض سرطان الثدي. يضم كل جزء من
الجزأين األساسيين المراحل التالية: المرحلة األولى هي استخراج الخصائص المهمة من خصائص فحص الدم الشامل وذلك
باستخدام خوارزميات معينة الستخراج وترتيب هذه الخصائص حسب أهميتها. المرحلة الثانية تكون بتصنيف البيانات
باستخدام تقنيات معينة للتصنيف. تصنف البيانات في حالة التشخيص إلى سليم أو مريض بالسرطان، أما في حالة التنبؤ
بحياة مريض السرطان فسوف تصنف البيانات إلى شخص ناجي من المرض أو شخص غير ناجي منه. وهذه البيانات تضم
المصابين بالسرطان فقط. إن المرحلة األخيرة هي حساب معايير التقييم لتحديد أفضل تقنية تصنيف وتضم هذه المعايير:
الدقة، الحساسية، النوعية، والمساحة تحت المنحنى وبعض المعايير األخرى. تتضمن نتائج تشخيص سرطان الثدي أن
فحص الدم الشامل األول عند دخول المريض للمستشفى تعطي أفضل النتائج بدقة 7.87 %ومساحة تحت المنحنى 70.9 .
وفي حالة التنبؤ بحياة مريض سرطان الثدي فإن أفضل النتائج تكون في حالة فحص الدم الشامل عند تاريخ التشخيص بدقة
تساوي 9.09 %ومساحة تحت المنحنى تساوي 00.9
Category
Theses and Dissertations

Same Subject

Journal articles
1
0
Kene, Terfa S.
Oman Medical Specialty Board.
2010-04
Theses and Dissertations
3
0
Al-Hinaiyah, Aisha Mohammed.
Sultan Qaboos University
2008
Theses and Dissertations
0
0
Al-Ajmiyah, Kawther Ibrahim Ali.
Sultan Qaboos University
2011
Theses and Dissertations
0
0
Al-Ghafri, Metab Khalaf Salim.
Sultan Qaboos University
2011
Theses and Dissertations
1
0
Al-Rawahiyah, Hasina Said Saif.
Sultan Qaboos University
2013