صدر حديثا عن مركز جامعة مصر للنشر كتاب “موارد الترجمة الآلية بين اللغة العربية والإنجليزية” للكاتب الدكتور محمد مجدي لبيب، مدرس الدراسات اللغوية والخبير في مجال حوسبة اللغة ومعالجة اللغات الطبيعية.
والكتاب عبارة عن دراسة لغوية حاسوبية تسعى لتحسين مخرجات الترجمة الآلية بين اللغة العربية واللغة الإنجليزية ورفع كفاءة تعامل الآلة مع اللغات الطبيعية خصوصا اللغة العربية من خلال الاستفادة من إمكانات الذكاء الاصطناعي، وهي دراسة بينية تتنوع محاورها بين عدة مجالات منها حوسبة اللغة ومعالجة اللغات الطبيعية والإحصاء اللغوي والترجمة الآلية، حيث يفتح آفاقًا جديدة أمام الباحثين والمهتمين بهذه المجالات.
وقوة الدِّراسة التي يقدمها هذا الكتابُ وتأثيره في مجال معالجة اللُّغات الطبيعيَّة خصوصَّا التَّرجمة الآليَّة، نابعة من كونها دراسة لغويَّة في المقام الأول، وأنها وضعت منهجيَّة علميَّة واضحة لتحسين مخرجات التَّرجمة الآليَّة بين اللُّغتين العربيَّة والإنجليزيَّة، وهو ما يفتح البابَ على مصرعيه أمام الباحثين اللُّغويين لخوض غمار مجال "الحوسبة اللُّغويَّة" أو "اللِّسانيَّات الحاسوبيَّة"؛ إذ استطاع الباحثُ بناء نموذج يمكن السيرُ على نهجه لتحسين مخرجات التَّرجمة الآليَّة بين لغتين، أيَّا كانت طبيعتهما.
والكتابُ يعدُّ مرجعًا مهمًّا للباحثين في مجال معالجة اللُّغات الطبيعيَّة وتوظيف الذَّكاء الاصطناعيّ في خدمتها؛ إذ إنه يقدِّم دراسةً علميَّةً جديدة نسبيًّا في العالم العربيّ، ويمهدُ الطَّريقَ أمام الباحثين العرب لاقتحام مجال خصب، له مستقبل واعد في ظلِّ التَّطوُّر التُّكنولوجي الحاصل حول العالم، فالباحثُ استطاعَ أن يدمجَ بين الإمكانات اليدويَّة والطَّاقات الآليَّة لتحقيق الهدف المنشود، فنجد أنَّ الدِّراسةَ قد حظيت بكم كبير من الأدوات وإجراءات الرَّصد لاستخراج الفروق بين التَّرجمة الآليَّة والتَّرجمة البشريَّة؛ لمحاولة حصر المشكلات وعلاجها، وبالرَّغم من وجود ذخائر لُغويَّة ومعاجم كثيرة سواء ثنائيَّة أو مصطلحيَّة، بيد أنَّ اللُّغةَ متجددةٌ وتحتاجُ إلى أن تعملَ هذه الآليَّة باستمرار، وتحدث إضافة مستمرة لهذه الذخائر والمعاجم.
كما أنَّ الدِّراسةَ لم تكتفِ بحصرِ مشكلات التَّرجمة الآليَّة بين العربيَّة والإنجليزيَّة، بل كان الهدفُ الأول منها هو وضع منهجيَّة لاستخراج المشكلات بأقل جهد وأكثر كفاءة ممكنة، والاستفادة من الأدوات والتقنيات المتاحة لحلِّ تلك المشكلات، وهو ما ركزت عليه الدِّراسةُ عند استخدامها أداة قياس نسبة التَّشابه الدِّلالي بين أزواج الجمل (Semantic similarity) الملحقة بحزمة تقنيات (BERT) المقدَّمة من شركة (Google)، بل إن الباحثَ لم يُقْصِرْ عملَه على الاستفادة من هذه التقنية فقط، لكنه تناولها بالدِّراسة العميقة، ووقَف على بعض الإخفاقات فيها عند التَّعامل مع اللُّغة العربيَّة، وقدَّم موردًا لُغويًّا يسهمُ في تحسين مخرجات تلك التقنية مستقبلًا، وهو ما يعدُّ واحدًا من مواضع قوة الدِّراسة وتميزها.
ومما ميَّز الدِّراسة أنها وظَّفت الإحصاءَ اللُّغويَّ لتوصيف البيانات والنتائج تلمُّسًا للدِّقة والوضوح في رصد المعلومات وتوصيف النَّتائج.
وبالتوازي، استخدم المحللات الصَّرفيَّة والمعنونات الآليَّة وتقنيات المحاذاة لمعالجة نصوص المدوَّنة لغويًّا واستخلاص المعلومات اللُّغويَّة التي يمكن الاستفادةُ منها في تحسين مخرجات التَّرجمة الآليَّة ورفع كفاءتها.
ونظرا للاهتمام بمثل هذه الدراسات، فقد صدر الكتاب بتقديم كل من الدكتور محسن رشوان، الأستاذ بكلية الهندسة جامعة القاهرة، الخبير بمجمع اللغة العربية، والحاصل على جائزة جائزة مجمع الملك سلمان للُّغة العربيَّة، في تخصص حوسبة اللُّغة العربيَّة وخدمتها بالتقنيات الحديثة، والدكتور المعتز باللغة السعيد، الأستاذ بجامعة القاهرة، والخبير بمجال حوسبة اللغة ومعالجة اللغات الطبيعية.