Identification of differential features for primary Sjogren's syndrome subtypes based on clustering.
تحديد السمات المميزة للمجموعات الفرعية لمتلازمة سجوجرن الأولية بناء على خوارزميات التعلم غير الموجه
Primary Sjogren's syndrome (pSS) is an autoimmune chronic
inflammatory disease with unique clinical presentation and variable
outcomes. It affects the exocrine glands including the salivary and
lacrimal glands, leading to the sicca syndrome, which is characterized by
dryness of the mouth (xerostomia), and eyes (xeropthalmia). Also, extra glandular organ manifestations may develop in some patients. Those
patients may later develop devastating symptoms. Initial indicative clinical
features and/or diagnostic markers of extra-glandular pSS are under investigated, which delay diagnosis, and management. We used a
clustering approach to evaluate and identify clinical manifestations and/or
biological markers (features) in Omani patients that may distinguish pSS
subtypes. This study was based on data for patients attending the
rheumatology clinic at SQUH diagnosed with only pSS (97).
Demographic, clinical, and laboratory data were retrospectively collected
from the SQUH information system. The studied cohort included 89
females (91.8%) and 8 males (8.1%), i.e., about 9:1 ratio. The average of
pSS patients' age at diagnosis is 38.2 years ± (10.4). Compared to other
populations, Anti-nuclear and Anti-SSA antibodies are more prevalent
(94.9%, 80.60%), while vasculitis and subjective oral sicca are less
prevalent (6.1%, 54.5%). To identify the potential pSS clusters, K-means
clustering was used. Features which were associated with the best
performance were identified. Silhouette and Calinski –Harabasz (CH)
scores were used for internal evaluation and for external evaluation, a
clinician reviewed the common features between each subtype. Using K means clustering, two clusters showed the best results, and 6 features
were identified (i.e., eye and mouth dryness, fatigue, CNS disorders, eye
symptoms, and age at diagnosis). The internal evaluation showed
satisfactory scores, 0.364, and 55.16, respectively. The identified clinical
and biological features that distinguish between the two pSS subtypes
may enable early diagnosis of subtypes and facilitate better targeted
الملخص العربي
متالزمة سجوجرن الأولية هي إحدى اضطرابات المناعة الذاتية التي تتميز بتعدد الأعراض والمضاعفات المرضية التي تصيب المريض، حيث أن الجهاز المناعي يهاجم الغدد اللعابية والدمعية؛ مما يسبب جفاف الفم والعين. ليس هذا وحسب بل قد يؤثر المرض أيضا على أعضاء الجسم المختلفة مثل الكلية، والقلب، والجهاز العصبي؛ مما يجعل المريض في حالة خطرة. تعيين الأعراض والبيانات التشخيصية الأولية التي قد ترتبط بمشاكل صحية خطيرة ضروري للتشخيص المبكر والقدرة على تفادي تطور المرض، وهي غيرمحددة حتى الأن. تهدف هذه الدراسة لتحديد الأعراض السريرية والحيوية الأولية للمرض في عمان وتصنيف المرضى لمجموعات مختلفة باستخدام خوارزميات التعلم غير المو جه (clustering(. تم تجميع عينة البحث من عيادة الروماتيزم التابعة لمستشفى جامعة السلطان قابوس البالغ عددهم 97 مريضا، حيث تم جمع البيانات السريرية و المختبرية والتقارير المرضية من نظام معلومات مستشفى جامعة السلطان قابوس. عينة البحث تتكون من 89 امرأة و8 رجال مما يعني نسبة حدوث المرض تقريبا .9:1 وتظهر أيضا الدراسة أن نسبة إيجابية الأختبار المختبري لألجسام المضادة الذاتية )-Anti and nuclear-Anti antibodies SSA )أعلى في عينة الدراسة مقارنة بالشعوب الأخرى ) 80.60% 94.9%,(، أما اللتهاب الأوعية الدموية(vasculitis (و جفاف الفم أقل مما سجل في الدراسات السابقة ) ,%6.1 .)%54.5 لتصنيف المرضى إلى مجموعات فرعية تم تطبيق الخوازمية التصنيفية(Clustering means-K (، وتم تحديد أهم الخصائص التي تميز مجموعة عن الأخرى و قياس جودة أداء الخوارزمية في تصنيف المرضى للمجموعات عن طريق مقياس score Silhouette و مقياس Harabasz –Calinski .(CH) scores أظهرت الخوازمية التصنيفية (Clustering means-K (أن أفضل تصنيف للمرضى هو مجموعتان وتم تحديد ستة سمات تشكل فارقا بين المجموعتين وتتمثل في جفاف العين والفم، الأعياء، مشاكل الجهاز العصبي المركزي، ومشاكل العين. ومقياسي التقييم للخوارزمية التصنيفية أظهر أنها اعطت نتائج جيدة (0.364 :score Silhouette(و(55.16 :scores) CH (، قوائم المرضى في كل مجموعة تمت مراجعتها من قبل أخصائي أمراض الروماتيزم كتقييم نهائي للنتائج. معرفة وتحديد الأعراض والدلائل المختبرية لنشوء المرض يساعد في التشخيص المبكر وتحديد نوعية العلاج المناسب لكل مريض.
