Document
An experimental evaluation of big-data processing overXML databases
Publisher
Sultan Qaboos University
Gregorian
2018
Language
English
English abstract
XML data stored in huge containers is classified as Big-Data. This data can appear in structured, semi-structured, and unstructured format so they cannot be processed in traditional relational database management systems. However, they can be processed using Big-Data management Systems such as Marklogic.XML features such as breadth and depth as well as XQuery categories can have an impact on Big-Data management systems. This research aims into identifying the features that can have an impact on these systems. To achieve this objective Marklogic, a Big-Data management system, is used to execute certain classes of XML queries over different categories of XML databases. The performance of Marklogic is measured by recording the queries elapsed time. Both datasets and query sets are taken from Extended 3D~XBech benchmark which has proven its superiority among the existing XML benchmarks.
The experimental results have shown that the breadth of the underlying XML database is a bottle-neck for the tested query types. In addition, the performance of the "Join-on-Values" query was too low, whereas the location of the sought-data in the database does not affect the performance much.As a future work, the experiment can be extended by testing more XQuery types and/or considering more metrics such as CPU usage, memory consumption, and IO-Operations. In addition, the experiment can be tested in a single or distributed system. Finally, further testing of different Big-Data NoSQL databases will help to give more confident on the highlighted results.
Description
Thesis
Member of
Resource URL
Arabic abstract
تجربة تقيد البيانات الضخمة لمعالجة قواعد بيانات M L العلبة العبرية الملخص: بسبب تنوع مصادر وأشكال المعلومات أصبح تطوير التكنولوجيا سريعا وينافس الحاجة لتحليل وتقيد العمليات في أجهزة الحاسب الألي وخاصة المعالجات تكنولوجيا البيانات الضخمة انتشرت على نطاق واسع لتغطي هذه الحاجة وتصنف قواعد بيانات الكس أم تل (LE لالي المنتشرة بأحجام متزايدة مثال على نوع البيانات التي من الممكن معالجتها باستخدام البيانات التقنية ( E-Dataيسبب طبيعة هذه البيانات مش أنها لا تتبع هیتل میني عن العقات مثل الجداول قفقد يوجد تحنيات المعالجةهذه البيانات حيث بكل مكان تتر معالج البيانات التخمة بانواع استعانت وينات أبعاد رنبية التلف النوع من قواعد البيانات: بعد الحجم و الذي يقاس بعدد العناصر النافلة، يعد العرض و الذي يقف بالتوسط عند البقاء لكل من في القاعدة ، و بعد الحق و الذي يقال بعد المستويات التقلة في القاعة تهنف هذه الدراسة الى معرفة الخصائص التي ممكن أن تؤثر إيجابيا نو بطريقة سلبية أثناء استعانت بیانات الأكل أم أل عنها تستخدم في بيئة البيانات الضخمة . والتحقق من مدى تأثير البيانات الضخمة فقد تم أختبار تطبيق البيانات الضخمة يلى (rkhosr ي تتم بتشغيل مجموعة محددة من الإستعنت (qaries) لاستخلاص مطومات معينة من مجموعة قواعد بيانات بائل كل منها خاصية أو أكثر من الخصائص الفتنة المذكورة أعلم يتم تسجيل الوقت الذي يستغرقه على استعلم حتی بعطي النتائج النهائية ليتم بعد تلك التحكيم بين الاستعلامات المقارنة (coupared X Queries) لقيف انت التأثير وتلتمن خلال مقارنة الوقت المستغرق اكلير عقد و نوع من الاستعدات المستخنية في العملية كة من قواعد البيانات والاستعانمت مكونه من المياه التي ابعاد بعد التحسين EXTENDING THE 3D) ARI الذي أثبت أنه مكان للمعاير السابقةMBE أوضحت النتائج أن بعد العرض للبيانات له تأثير سلبي على معظم الاستعانمات في بيئة البيانات الضخمة إضافة الى ذلك أن استعاد oin a talue) له تأشير يطية على أداء الوقت. بالمقابل بعد موقع البينت ليس له تأثير واضح على الأداء في بيئة البيانات التتمة وأخيرا، توصلت الدراسة إلى أنه يمكن إجراء المزيد من التجارب حول تأثير البيانات الضخمة للمجار الثني الأبعاد بعد التحصين (Extended 3D Bach)على عملية تقييم الأنظمة من خلال زيادة عدد استعانات و قال تثيرها أو قياس تر متغيرات أخرى خير الوقت مثل CPL U و MamooryCotsption و Operations-10. كما يمكن إعادة إجراء عملية تقييم المعيار المستخدم في هذه الدراسة على نطمة منفصلة ومقارنتها مع النظام الواحد في مقارنة برامج مختلفة لقواعد بيانات في بيئة البيانات الضخمة
Category
Theses and Dissertations