أخبار وتقارير

في اليوم العالمي للغة العربية.. تقنيات لدمج لهجاتها في برامج الذكاء الاصطناعي

تخصص الأمم المتحدة يومًا عالميًا للاحتفال بها، وهو الثامن عشر من 18 ديسمبر (كانون الأول)، من كل عام، وهي اللغة التي يتحدث بها نحو 400 مليون من سكان الأرض. قال عنها أمير الشعراء، أحمد شوقي (1870 – 1932) «إِنَّ الَّذي مَلَأَ اللُغاتِ مَحاسِنًا.. جَعَلَ الجَمالَ وَسَرَّهُ في الضادِ»، ويشهد العام الجاري 2023، مرور خمسين عامًا على اعتمادها ضمن اللغات الرسمية، ولغات العمل في الأمم المتحدة.

إنها اللغة العربية، واحدة من بين 6,500 لغة، يتحدثها شعوب الأرض، بحسب موقع «وورلد داتا إنفو»، ويمثل عدد المتحدثين بها نحو 4.7% على مستوى العالم. وتحتفل منظمة الأمم المتحدة للتربية والعلم والثقافة (اليونسكو)، بفعاليات اليوم العالمي للغة العربية 2023، تحت عنوان: «العربية لغة الشعر والفنون».

اقرأ أيضًا: (من الانكفاء إلى الانفتاح.. مبادرة أكاديمية في قطر لرصد السياسات اللغوية).

اليوم العالمي للغة العربية

قبل يومين، مرَّ عامان، على إدراج اليونسكو الخط العربي ضمن قائمتها للتراث غير المادي، والعام الماضي، في رسالة المديرة العامة لليونسكو، أودري أزولاي، بمناسبة اليوم العالمي للغة العربية 2022، قالت: «تُعدّ اللغة العربية حلقة وصل بين ثلاث قارات، إذ يعيش معظم الناطقين ﺑﻬا في منطقة تشكّل ملتقى طرق أوروﺑﺎ وآسيا وإفريقيا وملتقى سُبل التبادل. وتستمد اللغة العربية قوﺗﻬا وتنوعها من ﺗﺎريخها الطويل الممتد لألف عام ونيّف».

وأضافت: «ازدادت اللغة العربية تنوعًا على تنوعها، وثراءً على ثرائها من خلال ما استمدته من الثقافات الأخرى، فأفضى ذلك إلى إيجاد فكر ذي أهمية ﺗﺎريخية فريدة. ولا تقتصر منافع الموقع الجغرافي لتلك المنطقة الواقعة في قلب العالم على جعل اللغة العربية لغة التجار، بل تشمل جعلها لغة العلماء، والفنانين، والفلاسفة».

اقرأ أيضًا: (آليات تدريس الخط العربي.. جدل يواكب إدراج «تراث الجمال» في قوائم اليونسكو).

وبحسب الأمم المتحدة، يتوزع متحدثو العربية بين المنطقة العربية ومناطق أخرى مجاورة، مثل تركيا، وتشاد، ومالي، والسنغال، وإرتيريا، وهي لغة القرآن، وسادت لقرون طويلة من تاريخها بوصفها لغة السياسة والعلم والأدب، فأثرت تأثيرًا مباشرًا، أو غير مباشر في كثير من اللغات الأخرى، مثل: التركية، والفارسية، والكردية، والأردية، والماليزية، والإندونيسية، والألبانية، وبعض اللغات الإفريقية، مثل: الهاوسا، والسواحيلية، وبعض اللغات الأوروبية، وخاصةً المتوسطية منها مثل: الإسبانية، والبرتغالية، والمالطية، والصقلية.

https://www.bue.edu.eg/

ووفقًا للمنظمة، مثَّلت اللغة العربية كذلك حافزًا على إنتاج المعارف ونشرها، وساعدت على نقل المعارف العلمية والفلسفية اليونانية والرومانية إلى أوروبا في عصر النهضة.، كما أتاحت إقامة الحوار بين الثقافات على طول المسالك البرية والبحرية لطريق الحرير من سواحل الهند إلى القرن الأفريقي.

اقرأ أيضًا: (أكاديمي يقدم منهجًا جديدًا لتعليم العربية للأجيال الجديدة من «وارثي اللغة»).

الذكاء الاصطناعي يدعم العربية

في قصيدته بعنوان «اللغة العربية تتحدث عن نفسها»، يقول شاعر النيل حافظ إبراهيم (1872 – 1932) «وَسِعتُ كِتابَ اللَهِ لَفظاً وَغايَةً، وَما ضِقتُ عَن آيٍ بِهِ وَعِظاتِ، فَكَيفَ أَضيقُ اليَومَ عَن وَصفِ آلَةٍ، وَتَنسيقِ أَسماءٍ لِمُختَرَعاتِ». واليوم، مع انتشار تقنيات الذكاء الاصطناعي، أصبحت أبيات «حافظ» أمرًا واقعًا، في ظل جهود يقودها د. أحمد علي، مهندس أول في تقنيات اللغة العربية، بمعهد قطر لبحوث الحوسبة، بجامعة حمد بن خليفة، عضو «مؤسسة قطر»، يوضحها في هذه المقابلة مع «الفنار للإعلام»:

بداية هل ترى أن أحداث غزة الأخيرة زادت الاهتمام باللغة العربية

بالطبع، كان للأحداث الأخيرة في غزه مردود على الرأي العام العالمي، وعلى الاهتمام باللغة العربية. على سبيل المثال، هناك العديد من التصريحات والتسجيلات الصوتية، باللغة العربية الفصحى والشامية، وبالأخص الفلسطينية، التي يريد العالم أن يفهمها، وذلك يتطلب وجود تقنية حديثة لفهم محتوى هذه الملفات. وبالتالي، فقد زادت هذه الأحداث من الاهتمام بالتعرف على اللغة العربية بشكل أوسع، وكذلك اللهجات المختلفة. ونرى أن الاستثمار في هذه التقنية وسيلة مهمة، حتى يرى العالم جزءًا من الحقيقة لما يحدث في منطقتنا العربية.

تعد اللغة العربية أقل استخدامًا في مخرجات البحث العلمي على المستوى العالمي.. كيف يمكن تعزيز انتشارها؟

غالبية الأبحاث العالمية مخرجاتها باللغة الإنجليزية على مستوى العالم. اللغة العربية لها مميزاتها الخاصة؛ حيث إنها تتمتع بتنوع فريد بين اللهجات المنطوقة وطريقة الكتابة.

وخلال العقدين السابقين، كانت هناك موجتان من الزيادة في الأبحاث باللغة العربية، سواء المنطوقة أو المكتوبة. الأولى بعد أحداث 11 سبتمبر (أيلول) 2001، حيث زاد الاهتمام باللغة العربية لأغراض فهمها. أما الموجة الثانية، فقد واكبت web2.0 وطفرة المحتوي العربي على التواصل الاجتماعي، في عام 2011. على سبيل المثال، نشر مركز قطر لبحوث الحوسبة مئات الأبحاث في فهم وتحليل اللغة العربية في أفضل المؤتمرات العلمية.

عندما نتحدث عن الفصحى هناك لهجات أخرى.. هل الفصحى في خطر مع تطور الذكاء الاصطناعي؟

الذكاء الاصطناعي عبارة عن آلة يمكنها التعلم من البيانات التي تراها، تماماً مثل الطفل الصغير. على سبيل المثال، قمنا بتطوير ناطق آلي، يحول النص المكتوب إلى منطوق باللغة العربية الفصحى، لنشرات الأخبار والمناهج التعليمية. وكذلك طوَّرنا ناطقًا آليًا باللهجات المختلفة للأغراض الاجتماعية، حيث تكون اللهجات الدارجة هي السائدة.

وفقًا لتخصصك.. كيف يمكن معالجة الكلام عن طريق الحاسب الآلي؟

نظرًا لثراء اللغة العربية، فالتعامل معها يحتاج إلى مراعاة العديد من التحديات، ومعالجتها تحتاج إلى كم هائل من البيانات. من بين تلك التحديات غزارة وصعوبة الصرف العربي، مثل كلمة (وسيعالجونها) ستكون ترجمتها (and+they+will+cure+it).

غياب التشكيل تحدٍ آخر، مثل كلمة علم (عِلْم، عَلَم، عَلِمَ، عَلَّمَ..) cr: car, care, cure, core..، بالإضافة إلى المرونة النحوية؛ فالجملة تبدأ باسم أو فعل، وأحيانًا يسبق المفعول به الفاعل، وصعوبة التعرف على الأعلام (في الإنجليزية تبدأ الأعلام بحروف كبيرة)، وكذلك وجود الكثير من الأخطاء الإملائية والنحوية، وعدم الالتزام بعلامات الترقيم، بالإضافة إلى قلة الموارد اللغوية الإلكترونية المتاحة للباحثين.

هل هناك تقنيات أو أدوات تم تطويرها تدعم استخدام اللغة العربية؟

https://www.bue.edu.eg/

نهدف في معهد قطر لبحوث الحوسبة، ومجموعة تقنيات اللغة العربية، إلى دعم حضور اللغة العربية على الإنترنت، وذلك ببناء تقنيات تساعد الحاسوب على إتقان اللغة العربية، وجعلها مواطن من الدرجة الأولى في الفضاء الإلكتروني. ويعمل المعهد على المساهمة في بناء ودعم تقنيات اللغة العربية، وجعلها في متناول المطورين والمبرمجين، وكذلك المستخدمين، من خلال نشر بحوث متعلقة بهذه التقنيات، وبناء وتطوير برامج لمعالجة اللغة العربية.

وهناك مشروعات رئيسية تهتم بتقنيات اللغة العربية، مثل برنامج «فراسة»، للمعالجة الآلية للغة العربية، وبرنامج «أسد»، لتحليل وسائل التواصل الاجتماعي، واللغة العدائية، وخطاب الكراهية، والمشاعر، واللهجة، وغيرها. وبرامج «كناري» و«ناطق»، لتحويل الصوت المسموع إلى نص مكتوب والعكس، وبرنامج «شاهين»، للترجمة الآلية بين العربية (واللهجات) والإنجليزية، وبرنامج «تنبيه»، لتحليل الأخبار، والتعرف على الحملات الدعائية والشائعات، وتحديد المواقف الفكرية والسياسية، وغيرها، وبرنامج (NeuroX)، لفهم الشبكات العصبية وآليات تنبؤ الحاسب.

كيف يمكن الاستفادة من هذه التقنيات في مؤسسات التعليم العالي العربية؟

– تُعد جامعة حمد بن خليفة، الأولى في منطقة الشرق الأوسط، التي تقدّم دورات مكثفة مبتكرة مفتوحة عبر الإنترنت (MOOCs)، بالتعاون مع منصة «إيديكس»، وهي منصة تعليمية غير ربحية، تقدّم برامجها عبر الإنترنت، أسستها جامعة هارفارد، ومعهد ماساتشوستس للتكنولوجيا. هذه الدورات فرصة رائعة لاستخدام التكنولوجيا الحديثة في التعليم، ويمكن استخدام ميزة التعرف على الكلام لنسخ المحاضرات عبر الإنترنت، وتحليلات النص لتتبع تقدم تعلم الطلاب.

هل تساهم هذه التقنيات في تعليم اللغة العربية لغير الناطقين بها؟

مشروع QVoice هو بناء تكنولوجيا الكلام للتعلم التلقائي لنطق اللغة العربية، وتمكين متعلمي اللغة العربية من مختلف الفئات العمرية، وخلفيات اللغة الأم (L1)، من خلال الكشف الدقيق عن أخطاء النطق والتعليقات المناسبة. كما يهدف إلى تمكين المتعلمين، وخاصة المتحدثين غير الأصليين، من تعلم وممارسة اللغة العربية الفصحى الحديثة. ويهدف أيضًا إلى مساعدة الناطقين باللغة العربية على تقليل تأثير اللهجات، وتوفير تجربة تعليمية مصممة خصيصًا لتلبية الاحتياجات المحددة للمتعلمين الأفراد مع تعليقات مستهدفة. مثل هذه التجربة يمكن أن تعزز الثقة، وتشجع المتعلم على الاستمرار في التعلم.

كما يهدف المشروع إلى تعزيز أبحاث الكلام العربي، من خلال نمذجة المساحة الصوتية العربية بشكل أفضل، للتعامل مع اللهجات وأساليب التحدث المختلفة. ويهدف كذلك إلى تحسين نماذج الكلام الخاصة باللغة الثانية، واستكشاف تقنيات النمذجة الصوتية والتعزيز المختلفة، مع إثراء التعددية اللغوية، وإدخال تعدد الوسائط في أبحاث الكلام العربي.

اقرأ أيضًا: (ازدواجية اللغة وأثرها على مستويات تعليم التلاميذ العرب.. دعوة للمواجهة).

في ظل التضليل المعلوماتي وجهود التحقق.. كيف يمكن الاستفادة من تلك التقنيات؟

مشروع «تنبيه» في معهد قطر لبحوث الحوسبة (QCRI) يعمل على تطوير تقنيات تتعلق بتحليل المعلومات، وخاصة في سياق مكافحة الشائعات، وتعزيز مهارات فحص الوسائط. كما يهدف إلى معالجة التحديات التي يطرحها نشر المعلومات الكاذبة والشائعات في محتوى اللغة العربية. ويتضمن المشروع البحث وتطوير الأدوات والتقنيات، لاكتشاف وتحليل والتصدي لانتشار المعلومات الكاذبة عبر الإنترنت.

ويشدد المشروع على أهمية تعزيز التفكير النقدي، ومهارات فحص الوسائط، بين المستخدمين، لتمكينهم من التمييز بين المعلومات الموثوقة وغير الموثوقة. كان معهد أبحاث الحوسبة في قطر مشاركًا بنشاط في البحث المتعلق بمعالجة اللغة الطبيعية، وتعلم الآلة، واسترجاع المعلومات، وهي جوانب أساسية لتطوير أدوات كشف الشائعات، واستفادت منها مؤسسات إعلامية بالإضافة إلى الأمم المتحدة.

اقرأ أيضًا:

Countries

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى