التخطي إلى المحتوى

لا يقلّ عدد المخطوطات التاريخية العربية حول العالم عن ثلاثة ملايين مخطوط، حُقّق منها 10 بالمئة فقط، بحسب التقديرات. وهذه الثروة الهائلة موجودة في مئات المكتبات والمؤسسات المتحفية، وهي خارج الوطن العربي أكثر من كونها داخله.

ومع دخول الرقمنة عالم المكتبات، أصبح الحصول على نُسخ رقمية يسيراً، بدل الصعوبة الشديدة في إمكانية مَنْح المحقّقين مخطوطاتٍ نادرة يزيد عُمْر بعضها عن ألف عام. هذا يسَّر عملية الوصول إلى النُّسَخ، كما ظلَّت، لعقودٍ، عمليات التحقيق بطيئة تعتمد على القراءة التقليدية لفَكّ الخطوط اليدوية.

غير أن الذكاء الاصطناعي، الذي بدأ يقطع في وطننا العربي خطواتِه الأُولى منذ سنوات قليلة، سيُدخلنا مرحلة مبشّرة لم تعد تكتفي بالرقمنة فقط، بل بتحويل هذا التراث إلى نصٍّ مطبوع.

الصورة مطبوعة

تُمكن الآن رؤية خطوط “النسخ”، و”النستعليق”، و”الفارسي”، و”الرقعة”، و”المغربي”، تتحوّل إلى نص مطبوع على شاشة الكمبيوتر. هذه خطوات بسيطة لكنها استغرقت جهد سنوات، اضطلع به شباب تونسيون خبراء في الذكاء الاصطناعي ومستشارون في سلامة المعلومات ومطوّرون، منذ عام 2018.

هذا ما يُطلعنا عليه الخبير التونسي فراس بن عبيد، المدير التنفيذي لـ”مؤسسة ريفامبر”، الذي جمع معرفة فنية في تحقيق المخطوطات، ومعرفة عِلمية في الهندسة الكهربائية التي نال فيها شهادة الدكتوراه، وفي حقل الذكاء الاصطناعي.

تسهّل المنصّة تحويل الوثائق إلى نصوص مطبوعة وقابلة للبحث والتعديل

جاء اليوم “العالمي للغة العربية”، في الثامن عشر من الشهر الجاري، مناسَبةً للإعلان عن هذه المؤسسة العربية الرائدة، وصادف ذلك وجود بن عبيد في العاصمة القطرية، وقد تحدّث لـ”العربي الجديد”: “إن المنصة التي أُطلق عليها اسم ‘زنكي’ (وهي شخصية من التراث الإسلامي)، مدعومة بالذكاء الاصطناعي، تُمكّن المؤسسات ودُور النشر والجامعيين والحكومات وغيرهم من تحويل وثائقهم، الممسوحة ضوئياً أو المصوّرة، المخطوطة أو المطبوعة، إلى نص مطبوع قابل للتعديل والبحث فيه”.

ويضيف أن الأمر بدأ هواية، وبعد أن “تحقّقت نتيجة محترمة في بعض المخطوطات”، تقرّر عام 2020 أن تتحول الهواية إلى مسؤولية تحملها مؤسسة.

التعرف الضوئي

التعرّف الضوئي على الحروف OCR، اشتغلت عليه مختبرات عديدة في ألمانيا وروسيا وبريطانيا وغيرها، حيث يفيد بأن المؤسسة التي يديرها قطعت شوطاً في جعل منصة “زنكي” مُحرّك بحثٍ لا مجرّد تطبيق، وعليه، نالت ما يسمى “علامة المؤسسة الناشئة” من وزارة التكنولوجيا والاتصالات في تونس، والتي تُعطى للمؤسسات الريادية التي تجمع بين الابتكار والقدرة على التطوّر بشكل سريع.

وتقنياً، يشرح بن عبيد قائلاً إن الصورة الممسوحة ضوئياً، سواء أكانت مطبوعة أم مخطوطة تاريخية أم بخط اليد الحديث أم طباعة حجرية قديمة، تتحوّل إلى نص مطبوع، ما يوفّر على المُستخدم الجهد الذي يتكلّفه في الفحص والتثبُّت بالطريقة التقليدية.

نسبة عالية

ويفيد هنا بأن نسبةَ التعرّف إلى الحروف بلغت 94 بالمئة، وفي التعرّف إلى الكلمات 76 بالمئة، وفي عالم الذكاء الاصطناعي، كما يواصل حديثه، لم تبلغِ التطبيقات هذه النسبة، وهي ضمن المعايير تُعَدّ عالية، ولا ينقصها سوى مراجعة بسيطة لتغطية ما تبقّى من نسبة محتملة تبلغ 24 بالمئة لقراءة الكلمة، و6 بالمئة للحروف.

فراس بن عبيد (العربي الجديد)

كما أن نسبة التعرّف يُمكن أن تتحسّن بعد مراجعة الصفحات المحوّلة، وإرجاعها بضغطة زر للآلة، فيعاد تدريبها على التعديلات، وفي الصفحات الموالية، ترتفع نسبة الدقة بشكل تدريجي. وبما أنّ محرّك البحث أحدُ أبرز منتجات المؤسسة، فإن الميزة التي تضيفها للمستعملين تمنحُهم قابليةَ البحث رقمياً داخل الوثائق المصوّرة، مستغنين عن البحث الورقي.

أطلق على هذا المحرّك اسم “سبر”، ويقول بن عبيد: “يصبح البي دي أف قابلاً للبحث، ولو أمامك آلاف المخطوطات القديمة وأنت مهتمّ بأمر خاص تبحث عنه، يأخذُك ‘سبر’ فوراً إلى كلّ ما يتعلّق بمادّة البحث المصوّرة، قبل أن تطلب تحويلها إلى نص مطبوع”.

وبمجرّد أن تحوّل المصوّرات الى صيغة نصّية يمكن استثمارها في ما نشاء، عبر تحويلها إلى صوت، أو فيديو، واستخراج المعلومات المفيدة عبر توجيه السؤال إلى المخطوطة المعنية، كما يوضح.

خريطة بيانات

وفي السياق ذاته، ما دمنا نتحدّث عن ملايين المخطوطات، فإن السؤال دائماً هو كيف نصل إلى المخطوط المَعني؟ وهنا يخبرنا عن شراكة قائمة ينتظر أن تدخل حيز التنفيذ والإشهار، مع باحثين لديهم قاعدة بيانات ستتطوّر لتكون خريطة عالمية تُسهّل الوصول إلى المخطوطات، وفي مقدّمتهم أبو يعقوب عبد العاطي الأزهري الذي “بذل أموالاً وجهداً جباراً” في بيانات تضمّ مليوناً وسبعمئة ألف مخطوط.

وأخيراً، يرى بن عبيد أن الذكاء الاصطناعي لا يكفي وحده، بل يجب أن تتضافر الجهود بين المختصّين به وأهل فنّ المخطوطات لربط الخطّ العربي بأحدث التقنيات، وتوفير الحلول الذكية لتحويل الوثائق العربية المطبوعة والمخطوطة إلى نصوص قابلة للبحث والتعديل وإدارة وثائق المؤسسات العربية، وغيرها من التطبيقات القائمة على التعرّف الآلي على النص العربي.

التعليقات

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني.