إجراء الأبحاث في مجال معالجة اللغة الطبيعية (NLP) لا يختلف كثيراً عن مثيلاتها من المجالات الحاسوبية الأخرى، فهي إما أبحاث قائمة على التطبيقات (Applications-driven Research) أو أبحاث قائمة على الفضول (Curiosity-driven Research) دعونا نتعرف باختصار على هذين النوعين مع ذكر أمثلة عليها:
تشير الأبحاث القائمة على التطبيقات (Applications-driven Research) إلى الأبحاث التي تركز على تطوير تطبيقات معينة قائمة على معالجة اللغة الطبيعية، مثل الترجمة الآلية وتلخيص النص وتحليل المشاعر. يعتمد هذا النوع من البحث عادةً على الحاجة إلى تحسين أداء الأنظمة الحديثة للمعالجة الطبيعية للغة أو تطوير تطبيقات جديدة. وغالبًا ما يكون الدافع وراء هذا النوع من البحث هو الرغبة في حل مشكلات معينة أو تلبية احتياجات محددة في السوق أو المجتمع.
في المقابل الأبحاث القائمة على الفضول (Curiosity-driven Research): هي أبحاث تركز على استكشاف وفهم المبادئ الأساسية للغة الطبيعية وكيفية معالجتها من قبل البشر والآلات. غالبًا ما يكون الدافع وراء هذا النوع من البحث هو الرغبة في تعزيز فهمنا للغة وهيكلها، بدلاً من الرغبة في حل مشكلات محددة أو تلبية احتياجات محددة. من أمثلتها إجراء أبحاث لاختبار معماريات الشبكات العصبية لفهم اللغة الطبيعية وتوليدها، وتطوير خوارزميات جديدة للتحليل النحوي (syntactic parsing) ووصف الأدوار الدلالية (semantic role labeling).
ملاحظة: في الأوراق البحثية في مجال معالجة اللغة الطبيعية سنجد في أحياناً كثيرة استخدام كلا النوعين في نفس الورقة!
لكن يبقى السؤال الأهم وهو كيف يمكن الحصول على أفكار بحثية في المجال؟
هناك طريقتان أساسية للحصول على أفكار بحثية في معالجة اللغة الطبيعية (NLP) وغيرها من المجالات هما: الاكتشاف التصاعدي (Bottom-up Discovery) والتصميم التنازلي (Top-down Design).
الاكتشاف التصاعدي هو نهج بحثي يبدأ فيه الباحثون بجمع البيانات وتحليلها، ثم استخدام هذه البيانات لتشكيل فرضيات وتطوير أفكار بحثية جديدة. غالبًا ما يستخدم هذا النهج في البحث القائم على البيانات (data-driven research)، حيث يكون الهدف هو تحديد الأنماط أو الرؤى في البيانات التي يمكن استكشافها بشكل أكبر. على سبيل المثال، قد يبدأ الباحث بجمع مجموعة بيانات كبيرة لتفاعلات خدمة العملاء واستخدام هذه البيانات لتحديد مشكلات العملاء الشائعة أو أنماط اللغة الشائعة. ومن هذا المنطلق، يمكنهم تطوير أفكار بحثية جديدة حول كيفية تحسين تجربة خدمة العملاء.
في المقابل، التصميم التنازلي هو نهج بحثي يبدأ فيه الباحثون بسؤال أو مشكلة بحث واضحة ثم يصممون التجارب أو طرق جمع البيانات للإجابة على هذا السؤال. غالبًا ما يستخدم هذا النهج في البحث القائم على النظرية (theory-driven research)، حيث يكون الهدف هو اختبار فرضية معينة أو فهم ظاهرة معينة. على سبيل المثال، قد يبدأ الباحث برغبته في فهم كيفية معالجة البشر للغة الطبيعية ثم تصميم تجارب لاختبار جوانب معينة من هذه العملية، مثل دور السياق في فهم اللغة.
ختاماً، يمكن للباحثين استخدام كلا النهجين في أبحاثهم، بحيث يتم الجمع بين الاكتشاف التصاعدي والتصميم التنازلي من خلال البدء بسؤال أو مشكلة بحثية واضحة، وجمع البيانات وتحليلها، ثم استخدام البيانات لتحسين سؤال البحث واستكشاف مجالات بحث جديدة. يمكن أن يوفر هذا المزيج توازنًا بين البحث المبني على البيانات والمبني على النظرية، مما يؤدي إلى فهم أكثر شمولاً للموضوع.