Document

Generalized linear modeling of count and categorical data with applications

Publisher
Sultan Qaboos University
Gregorian
2018
Language
English
English abstract
The traditional linear regression models are developed assuming that the response variable is independently normally distributed with constant variance. However, in many practical applications we encounter a lot of response variables which are not continuous but either categorical or count variables and these variables do not follow the basic assumptions of ordinary linear regression model. Besides, given the categorical nature of the dependent variable, the regression function cannot be linear and thus we cannot analyze count and categorical data using ordinary regression model. However, under certain transformations all these problems can be overcome by following a unified approach which is referred to as Generalized Linear Model (GLM). The objectives of this project are to provide an overview of modeling count and categorical data using GLMs with their applications to real data from Oman National Reproductive Health Survey 2008 and the Sultan Qaboos University student's performance data. The basic GLM for count data is the Poisson model with log link. Frequently, count data are often over-dispersed (variance of the response variable greater than the mean) and invalidating the use of the Poisson distribution. In these conditions, some extensions of Poisson model are usually used to deal with over-dispersion, including the Negative Binomial, Zero-Inflated Poisson (ZIP) and Zero-Inflated Negative Binomial (ZINB). The study empirically assessed the robustness of Poisson model and its extensions to overdispersion situations in count data and found that Zero-Inflated Poisson performs better for analyzing over-dispersed count data related to number of children ever-born to women. This study also provides an overview of modeling categorical data using logistic regression model with application to empirical data obtained from the 2008 Oman National Reproductive Health Survey (ONRHS) related to use of contraceptive method. Binary logistic regression models were used to identify the significant predictors of contraceptive use or non-use. Multinomial logistic regression model was used for analyzing data related to more than two categories measured in nominal category and ordinal category.
Description
Thesis
Arabic abstract
تقوم بعلاج الانحدار الخطي التقليدية على افتراض أن تغير المستقل يتم توزيعه بشكل طبيعي مع تباين ثابت. ومع ذلك ، في العديد من التطبيقات العملية، تواجه الكثير من المتغيرات المستقلة التي لا تكون متواصلة ولكنها تكون إما قوية و عية ، وهذه المتغيرات تتبع الافتراضات الأساسية النموذج الانحدار الخط العادي إلى جانب ذات، وبالنظر إلى الطبيعة المئوية للمتغير التابع ، فين دالة الانحدار لا يمكن أن تكون خطية و بالتالي لا يمكننا تحليل البيانات الفنية والبيانات القوية باستخدام نموذج الانحدار الخطي العادي ومع قلات ، في ظل بعض التحولات، يمكن النت على كل هذه المشكلات باتباع نهج موحد يشار إليه بالنموذج الخطي المعصم (GLM). تتمثل أهداف هذا المشروع في تقديم لمحة عامة عن تحليل البيانات المعنية والقوية بانتظام نمذج GLM مع تطبيقاتها من بيانات حقيقية مأخوذه من المسرح الوطني للصحة الإنجابية في عمان عام 2008 وبيانات أداء طلاب جامعة السلطان قابوس عام 2013 الأخيار الأمثل لتحليل البيانات العادية هو نموذج بواسون مع الوصلة اللوغاريتية كثيرا ما تكون البيائك العادية متفرقة بشكل مفرط (تباين المتغير المستقل أكبر من المتوسط الحسابي) وهذا يبطل استخدام نموذج يواسون، وفي هذه الظروف، يتم استخدام تماذج ممتدة من نموذج بواسون للتعامل مع الإفراط في التشتت مثل: شيجاتيف بانومیال (B) وزبرو اتفليتيد بواسون (ZIP) وزیرو انفليشيد نيجنيف باینومیل (ZINB). فيمت الدراسة بشكل تجريبي قوة نموذج بواسون وتوسعته الحالات التشتت المفرط في البيانات العادية ووجدت أن أفضل نموذج التطبل بیانت العد المفرط المتعلقة بعند الأطفال المولودين من النساء هو نموذج (2IP).
Category
Theses and Dissertations

Same Subject

Theses and Dissertations
0
0
Al-Amriyah, Kawkab Abdullah Nabhan.
Sultan Qaboos University.
2023
Theses and Dissertations
0
0
Al-Rawahiyah, Bushra Said Mohammed.
Sultan Qaboos University.
2019
Theses and Dissertations
0
0
Al-Hinai, Khalid Mohammed Adi.
Sultan Qaboos University
2014