مشروع أريب (ARIB) من فكرة محلية للمنافسة العالمية

تعود أحداث نشأة مشروع أريب (ARIB) ليوم 18 ديسمبر 2014م (اليوم العالمي للغة العربية)، حينما شاركت مجموعة إيوان البحثية  بالاحتفال باليوم العالمي للغة العربية. فقبل ذلك اليوم تم نشر تغريدة عبر حساب المجموعة البحثية في تويتر لاقتراح أفكار تقنية لإثراء اللغة العربية، وقد وصلت المجموعة حوالي 18 فكرة تم تصفيتها إلى ثلاثة أفكار مرشحة وكان من ضمنها فكرة موقع تصحيح القواعد الإملائية والنحوية للأستاذ عبدالله الصقعبي المتخصص في تقنيات التعليم بجامعة الملك عبدالعزيز.
اجتمع فريق من عضوات المجموعة البحثية مكون من أ. نوف الشنيفي (معيدة بالكلية) و أ.رحاب النفيعي (طالبة ماجستير) ود.مها اليحيى وأنا، لتداول الفكرة المقترحة ودراسة مدى إمكانية تحقيقها. واستمرت الاجتماعات الدورية بين أعضاء الفريق حسب جدول زمني وخطة بحثية محددة، إلى أن جاء ذلك اليوم والذي قررنا فيه أن يكون توجه المشروع بحثي تنافسي عبر المشاركة في منافسة دولية تدعى (Second Shared Task on Automatic Arabic Error Correction) التابعة للورشة الدولية لمعالجة اللغة العربية والتي علمت عنها من الزميل د.نزار حبش. حينها زادت جرعة الحماس في فريق المشروع لإنجاز مخرجات النظام حسب المعايير المطلوبة للمنافسة.

تتمثل فكرة هذه المنافسة الدولية في عامها الثاني حول ارسال مصادر لغوية لنصوص عربية تحتوي على الكثير من الأخطاء الإملائية الشائعة وغير الشائعة، وعلى الفريق المشارك القيام بتصحيح هذه النصوص آلياً باستخدام خوارزميات مختلفة للوصول لأعلى نسبة من الدقة.

استندنا في نظام أريب على خوارزميتين لم تستخدم من قبل للغة العربية هما (Probability-Based Spelling Corrector) و (Distance-Based Spelling Corrector) هذه الخوارزميات وعلى بساطتهما لم تستخدم من قبل لمعالجة الأخطاء الإملائية للغة العربية. ويوضح الرسم في الأسفل خطوات عمل النظام والأنظمة المختلفة التي تم توظيفها للحصول على الناتج النهائي.

وصف لهيكلة نظام أريب

شكل 1: خطوات عمل نظام أريب للتصحيح الإملائي

ولما قارب وقت تسليم مخرجات النظام للمنافسة، كان لزاماً علينا القيام باختيار اسم أو رمز للنظام بالانجليزية لا يتعدى الأربعة أحرف -حسب شروط المنافسة-، ووقع اختيارنا على كلمة أريب (ARIB) والتي تعني الشخص الماهر أو الحاذق (معجم المعاني). وكان الشعور الذي راودني في حينه والذي دائما ما كنت أردده على الفريق بأن سيكون لأريب شأن بإذن الله تعالى.
ولما وصلتنا نتائج ترتيب الفرق المشاركة وجدنا أن أريب قد أبلى بلاء حسنا ولله الحمد وتبوء مراكز مشرفة في هذه المنافسة الدولية كأول مشاركة نوعية للمجموعة البحثية في هذا المجال.

من خلال هذه التجربة والتي أحب أن أطلق عليها “مغامرة بحثية” تبين لنا أن أحد عوامل الدفع بحركة البحث العلمي هو الرغبة في المشاركة في منافسات دولية والتي تساعد على صقل مهاراتنا البحثية ومقارنة مخرجاتنا مع نظرائنا في الدول الأخرى.

تعليق أخير: سنتيح قريباً بإذن الله الورقة الكاملة للنظام حال نشرها في موقع المؤتمر، كما أن على الراغبين بالاستفادة من قاموس المفردات الكبير الذي تم انتاجه من هذا المشروع زيارة حساب مجموعة إيوان في خدمة GitHub.

تعليقان

أضف تعليقا ←

  1. mostafa قال:

    خطيييييييييييييييييييير //// قمت بالتحميل وجارى التجربة
    قمت من فترة طويلة بتجربة نظام برمجى للترجمة الصحيحة من وإلى العربية بنسبة خطأ معدومة ؛ إلا أن الموارد حالت , فتركته جانبا ًوإنشغلت بآخر.

    أجد فعلاً جزئية الترجمة أمر مهم وشاق جداً برمجياً بدون نسبة خطأ ؛ هذا إن تم فى رأييى فصناعة الروبوت ستتقدم بشكل مذهل !!!!

  2. mostafa قال:

    عذراً لما تحدثت فى التعليق السابق عن المشروع البرمجى الخاص بالترجمة من باب تكاملية التصحيح النحوي والبرمجى مع هذا التطبيق الذى كنت أريد إنجازه

التعليقات معطلة.