Document
مقارنة في الخصائص السيكومترية و أداء الطلاب بين الصورتين الإلكترونية و الورقية لاختبار تحصيلي في مادة الرياضيات البحتة للصف الحادي عشر
Publisher
جامعة السلطان قابوس
Gregorian
2010
Language
Arabic
Subject
English abstract
The study aimed to develop an achievement test in pure mathematics for Grade eleven in two methods: first paper based test and the second was computer based test, in order to compare the psychometric proprieties of the two versions and compare the results of students in both versions, and also to compare the time it takes to resolve each test. The study sample consisted of 54 grade 11 students (28 students for the first group, and 26 students for the second group). Raven's Progressive Matrices and attitude scale towards the computer had been using to verify the equivalence of the two groups in intelligence and attitude towards the computer.
To answer question one, Cronbach's alpha was used and found 0.75 for the first test of the first group, and 0.87 for the second group. The second test had found 0.79 in the first group and 0.91 for the second group. This results were indicators of high stability and acceptable in both tests for both groups.
To answer question two, difficulty index was used and showed that there were no statistically significant differences between the difficulty index of the questions in both paper and electronic versions.
To answer question, three regarding to the discrimination index of the questions in both versions there were calculated discrimination index in two ways first by calculating the correlation coefficients between the degree of the question, and the scale of the test, while the second method has been by creating a higher category and lower category and then calculate the ratio between the number of correct answer in the higher category and the number of correct answers of the lower category to half the number of groups, The results showed low coefficients of discrimination in the first group for the second group different mode of the test. The results of "T" test for the independent sample showed that no statistically significant differences between the two versions in the discrimination index in the first test, while the difference in the second test was statistically significant differences to the approved version of the computer.
To answer the question four the independents sample "T" test was used to compare the results of students on tests in both versions and the results showed no statistically significant differences between the results of students. Also paired sample test "T" was used to compare the results of students within each group and showed that results was significant differences in both groups for the first test.
Also an independent-samples "T" test was used to compare the test time it takes to perform testing and showed that there are statistically significant differences for the computer based version in the two tests, but for the outcome of differences in time within each group the paired-samples "T" test showed that no statistically significant differences between the two versions in the first group, while the results were statistically significant differences to the computer based version in the second group.
Finally, the interpretation of the results has been made in the light of the theoretical fame and previous studies. Also, a number of recommendations and suggestions have been made.
Member of
Resource URL
Arabic abstract
هدفت هذه الدراسة إلى إعداد اختبار تحصيلي في مادة الرياضيات البحتة للصف الحادي عشر في صورتين الأولى تقليدية معتمدة على الورقة والقلم والثانية إلكترونية معتمدة على الحاسب الآلي، وذلك لأجل إجراء مقارنة في الخصائص السيكومترية للنسختين ومقارنة نتائج الطلبة في كلتا النسختين، والزمن المستغرق للإجابة عن كل اختبار. وقد طبقت الدراسة الحالية على عينة تألفت من 54 طالبة (28 طالبة المجموعة الأولى، و 26 طالبة المجموعة الثانية)، وقد تم استخدام اختبار رافن للذكاء، ومقياس في الاتجاه نحو الحاسب الآلي للتحقق من تكافؤ المجموعتين في الذكاء والاتجاه نحو الحاسب الآلي.
وللإجابة عن السؤال الأول المتعلق بمؤشرات الثبات، تم حساب معامل الثبات بطريقة ألفا كرونباخ لكل اختبار، وقد بلغت معاملات ثبات الاختبار الأول 0.75 للمجموعة الأولى، و0.87 للمجموعة الثانية. أما الاختبار الثاني فقد بلغ معامل الثبات في المجموعة الأولى ۷۹,. أما في المجموعة الثانية فقد بلغت قيمة معامل الثبات 0.91 وهي مؤشرات ثبات مقبولة.
وللإجابة عن السؤال الثاني المتعلق بدلالة الفروق في معاملات الصعوبة بين النسختين فقد تم حساب معاملات الصعوبة للاختبارين في كلا الطريقتين وقد أوضحت النتائج عدم وجود فروق ذات دلالة إحصائية بين معاملات صعوبة الأسئلة في كلا النسختين الورقية والإلكترونية.
وللإجابة عن السؤال الثالث والمتعلق بمعاملات تمييز الأسئلة في كلا النسختين تم حساب معاملات التمييز بطريقتين الأولى عن طريق حساب معاملات ارتباط الفقرات بالدرجة الكلية للاختبار، أما الطريقة الثانية فقد تمت عن طريق إيجاد الفئة العليا والفئة الدنيا ثم حساب نسبة الفرق بين عدد الإجابات الصحية في الفئة العليا وعدد الإجابات الصحيحة من الفئة الدنيا إلى نصف عدد أفراد المجموعتين، وقد أوضحت النتائج انخفاض معاملات التمييز في المجموعة الأولى عن المجموعة الثانية باختلاف طريقة تقديم الاختبار، وقد أعطت نتائج اختبار ته لدلالة الفروق بين النسختين في معاملات التمييز عدم وجود فروق دالة إحصائيا في الاختبار الأول، في حين كانت الفروق دالة في الاختبار الثاني لصالح النسخة المعتمدة على الحاسب الآلي.
وللإجابة عن السؤال الرابع تم اولا استخدام اختبار "ت" لمجموعتين مستقلتين لمقارنة نتائج الطالبات على الاختبارين في كلا النسختين وأظهرت النتائج عدم وجود فروق ذات دلالة إحصائية بين نتائج الطالبات، كما تم مقارنة النتائج داخل كل مجموعة فأظهرت وجود فروق دالة إحصائيا في كلا المجموعتين لصالح الاختبار الأول باختلاف الطريقة التي قدم بها.
أما فيما يتعلق بالنتائج المرتبطة بالزمن المستغرق لأداء الاختبار فقد أظهرت نتائج اختبار "ت" المجموعتين مستقلتين وجود فروق دالة إحصائيا لصالح النسخة المعتمدة على الحاسب الآلي في كسلا الاختبارين، أما بالنسبة لنتائج الفروق في الزمن داخل كل مجموعة فقد أظهرت نتائج اختبار "ت" لمجموعتين مترابطتين عدم وجود فروق دالة إحصائيا بين النسختين في المجموعة الأولى، في حين كانت النتائج دالة الصالح النسخة المعتمدة على الحاسب الآلي في المجموعة الثانية. ولقد تم تفسير نتائج الدراسة في ض وء الإطار النظري، والدراسات السابقة، كما تم الخروج بعدد من التوصيات والمقترحات.
وللإجابة عن السؤال الأول المتعلق بمؤشرات الثبات، تم حساب معامل الثبات بطريقة ألفا كرونباخ لكل اختبار، وقد بلغت معاملات ثبات الاختبار الأول 0.75 للمجموعة الأولى، و0.87 للمجموعة الثانية. أما الاختبار الثاني فقد بلغ معامل الثبات في المجموعة الأولى ۷۹,. أما في المجموعة الثانية فقد بلغت قيمة معامل الثبات 0.91 وهي مؤشرات ثبات مقبولة.
وللإجابة عن السؤال الثاني المتعلق بدلالة الفروق في معاملات الصعوبة بين النسختين فقد تم حساب معاملات الصعوبة للاختبارين في كلا الطريقتين وقد أوضحت النتائج عدم وجود فروق ذات دلالة إحصائية بين معاملات صعوبة الأسئلة في كلا النسختين الورقية والإلكترونية.
وللإجابة عن السؤال الثالث والمتعلق بمعاملات تمييز الأسئلة في كلا النسختين تم حساب معاملات التمييز بطريقتين الأولى عن طريق حساب معاملات ارتباط الفقرات بالدرجة الكلية للاختبار، أما الطريقة الثانية فقد تمت عن طريق إيجاد الفئة العليا والفئة الدنيا ثم حساب نسبة الفرق بين عدد الإجابات الصحية في الفئة العليا وعدد الإجابات الصحيحة من الفئة الدنيا إلى نصف عدد أفراد المجموعتين، وقد أوضحت النتائج انخفاض معاملات التمييز في المجموعة الأولى عن المجموعة الثانية باختلاف طريقة تقديم الاختبار، وقد أعطت نتائج اختبار ته لدلالة الفروق بين النسختين في معاملات التمييز عدم وجود فروق دالة إحصائيا في الاختبار الأول، في حين كانت الفروق دالة في الاختبار الثاني لصالح النسخة المعتمدة على الحاسب الآلي.
وللإجابة عن السؤال الرابع تم اولا استخدام اختبار "ت" لمجموعتين مستقلتين لمقارنة نتائج الطالبات على الاختبارين في كلا النسختين وأظهرت النتائج عدم وجود فروق ذات دلالة إحصائية بين نتائج الطالبات، كما تم مقارنة النتائج داخل كل مجموعة فأظهرت وجود فروق دالة إحصائيا في كلا المجموعتين لصالح الاختبار الأول باختلاف الطريقة التي قدم بها.
أما فيما يتعلق بالنتائج المرتبطة بالزمن المستغرق لأداء الاختبار فقد أظهرت نتائج اختبار "ت" المجموعتين مستقلتين وجود فروق دالة إحصائيا لصالح النسخة المعتمدة على الحاسب الآلي في كسلا الاختبارين، أما بالنسبة لنتائج الفروق في الزمن داخل كل مجموعة فقد أظهرت نتائج اختبار "ت" لمجموعتين مترابطتين عدم وجود فروق دالة إحصائيا بين النسختين في المجموعة الأولى، في حين كانت النتائج دالة الصالح النسخة المعتمدة على الحاسب الآلي في المجموعة الثانية. ولقد تم تفسير نتائج الدراسة في ض وء الإطار النظري، والدراسات السابقة، كما تم الخروج بعدد من التوصيات والمقترحات.
Category
Theses and Dissertations