تَفَرُّد نت - Tafarud.net

أسرار النصوص اليابانية القديمة تم الكشف عنها باستخدام الذكاء الإصطناعي

إن محتوى المليارات من النصوص القديمة المكتوبة بخط ياباني عفا عليه الزمن قد حير الباحثين الذين يكافحون لفك شفرة الأسرار الكامنة داخل هذه النصوص.

يُعرف هذا النص القديم المسمى Kuzushiji, بأنه استخدم منذ القرن الثامن وحتى بداية القرن العشرين, لكن أقل من 0.01 في المائة من سكان العالم يمكنهم قراءته حاليًا.

تم تحويل جزء صغير فقط من نصوص Kuzushiji إلى أحرف Kanji الحديثة مع مئات السنين اللازمة لنسخ اللغة يدويًا (Kanji هي الأحرف الصينية المعتمدة المستخدمة في نظام الكتابة اليابانية).

ومع ذلك, فإن أحد الباحثين في مركز ROIS-DS الياباني للبيانات في العلوم الإنسانية, Tarin Clanuwat, على وشك إحراز تقدم مذهل.

يعمل الباحثون حاليًا على تطوير نظام التعرف البصري على الحروف باستخدام التعلم العميق لتحويل حروف Kuzushiji إلى أحرف Kanji القابلة للبحث.

“لقد تم معرفة كل شيء نعرفه عن الثقافة اليابانية والتاريخ من الأدب عن طريق الوثائق المكتوبة بخط اليد قبل اختراع الحاسب الآلي وبدء العصر الرقمي للمستندات” كان نطاق التحقق في التراث الياباني القديم ضيق النطاق وما زال يتطلب إدخالًا بشريًا لتمييز المعلومات المكتوبة في الوثائق, لذلك وجب الاستعانة بطرق التعلم العميق لتسهيل تلك المهمة الشاقة.

تمت كتابة الملايين من الكتب والوثائق بخطًا قديمًا يدعى Kuzushiji
تمت كتابة الملايين من الكتب والوثائق بخطًا قديمًا يدعى Kuzushiji

“إذا استطعنا نسخ النصوص المكتوبة بخط اليد ونقل بياناتها إلي الخوارزمية وإنشاء محرك بحث يمكنه تمييز والعثور على كلمة معينة داخل النصوص القديمة, فسوف نعرف ما هو موجود في النصوص الأخرى بسرعة أكبر لأنه سيصبح لدينا مرجعية نعتمد عليها لتمييز تلك الكلمات الموجودة في تلك الوثائق التاريخية.”

وقد ساعد Alex Lamb عالم أبحاث معهد الخوارزميات التابع لمعهد مونتريال في هذا المشروع وقال إن الدعم الفني من شركة Google باستخدام الذكاء الإصطناعي ومجموعة البيانات التي تم جمعها من القرن السابع عشر إلى التاسع عشر من المعهد الوطني للأدب الياباني قد مكن برنامج التعلم الآلي لفك شفرة أكثر من 4000 حرف مختلف من اللغة.

الفرق بين النص المطبوع عام 1772 والنص المطبوع عام 1900.
الفرق بين النص المطبوع عام 1772 والنص المطبوع عام 1900.

“كلما بدأت تشغيل برنامج للتعلم الآلي, فأنت تريد أن تبدأ بشيء بسيط حقًا حتى تتمكن من التأكد من قيامك بالشيء الصحيح وليس بشيء بالغ الصعوبة”

“في محاولتنا الأولى, اكتشفنا حرفيًا حرفًا واحدًا وانتقل تدريجًا إلى 400 حرفًا ثم 4000 حرفًا. إنه يتحسن باستمرار ولا يزال هناك مجال كبير للتقدم”.

وقالت السيدة Clanuwat إن النموذج يمكنه فك شفرة صفحة واحدة من النص في غضون ثانيتين, بمعدل دقة يبلغ 85 في المائة.

وقالت “المشكلة في اللغة اليابانية هي أن هناك العديد من الحروف المختلفة, لا يمكننا العثور على عينات كافية لتدريب خوارمية التعلم الآلي [ما يكفي من الدقة بنسبة 100 في المائة]”.

“الشيء الوحيد الذي أثار إعجابي هو أن النموذج يمكن أن يميز إذا كان هناك شيء ما أو صورة – الرسوم التوضيحية تبدو قريبة من الحروف وفوجئت أنها ذكية بما يكفي لتخطيها.

“أعتقد أنه مع مزيد من التعاون بين البشر والآلات, من الممكن أن ترتفع الدقة إلى حد كبير.”

تمت ترجمة المقال الأصلي والموجود بالرابط أدناه

https://www.9news.com.au/technology/artificial-intelligence-ancient-japanese-kuzushiji-texts-being-decoded-by-ai-google-machine-learning-tech-news-update/18669e01-e7f7-4ff4-b30d-885549a7a952

 

حساب تويتر

تابعوا حساب تويتر للمقالات باللغة الانجليزية.