تَفَرُّد نت - Tafarud.net

اكثر من 29,000 بحث علمي متاح الآن لباحثي الذكاء الاصطناعي لمحاربة فيروس COVID-19

أصدرت خمس مؤسسات الاثنين مجموعة بيانات جديدة تضم أكثر من 29,000 مقالة علمية منشورة في الدوريات والمجلات العلمية، على أمل تحفيز خبراء الذكاء الاصطناعي على تطوير تقنيات جديدة لتنقيب البيانات والنصوص التي يمكن أن تساعد في الإجابة عن بعض الأسئلة الأكثر إلحاحاً حول الفيروس التاجي الجديد COVID-19 والمرض الذي يسببه. تعد مجموعة البيانات هذه المجموعة الأكثر شمولاً من نوعها فيما يتعلق بالفيروس التاجي، والأهم من ذلك أنها متوفرة الكترونياً وقابلة للقراءة من قبل الخوارزميات وبالتالي يسهل معالجة المعلومات حاسوبياً على يد أخصائيي الذكاء الاصطناعي.

إلا ان هنالك عقبة شائعة امام الباحثين في مجال التعلم الآلي الذين يبحثون عن بيانات قابلة للاستخدام، لإن محتويات قاعدة البيانات متباينة من حيث مدى شموليتها. حوالي 13,000 مقالة فقط في مجموعة البيانات تتضمن النص الكامل، مما يعني أن جميع محتوى المقالة متاح. اما المقالات الأخرى التي يبلغ عددها حوالي 16,000 مقالاً فتتضمن بيانات وصفية فقط، مثل أسماء المؤلفين أو ملخص الورقة البحثية، ويرجع سبب ذلك الى ان جزء كبير منها تتطلب دفع رسوم قبل الاطلاع على المحتوى.

تم بناء مجموعة البيانات هذه والتي أطلق عليها اسم CORD-19، اختصاراً لمجموعة COVID-19 Open Research Dataset، من خلال تعاون المنظمات التي تعمل في قطاعات مختلفة. ساهمت شركة مايكروسوفت ومن خلال معهد Allen Institute for AI، وهو أحد معاهد البحث التي أسسها مؤسس Microsoft الراحل بول الن، بتحويل المحتوى إلى صيغة يمكن قراءتها الكترونياً. كما وقدمت مكتبة الطب الوطنية التابعة للمعاهد الوطنية للصحة الوصول إلى محتوى المقالات العلمية. اما مبادرة Chan Zuckerberg، وهي المؤسسة الخيرية التي أطلقها مؤسس فيسبوك مارك زكربيرك وزوجته طبيبة الأطفال بريسيلا تشان، وفرت الخوادم التي تم نشر المقالات عليها. كما وقام مركز جامعة جورجتاون للأمن والتكنولوجيا الناشئة بتنسيق المبادرة. وقد كان إنشاء مجموعة البيانات هذه بطلب من مكتب سياسة العلوم والتكنولوجيا بالبيت الأبيض.

وكجزء من المبادرة، تم نشر 10 أسئلة على منصة Kaggle، وهي تجمع الكتروني لباحثي الذكاء الاصطناعي، المملوكة لشركة غوغل. من بين الاسئلة كان: “ما الذي نعرفه عن جينات الفيروس وأصله وتطوره؟”، “ماذا نعرف عن مخاطر فيروس COVID-19؟” و “ما الذي تم نشره بخصوص ابحاث العلوم الأخلاقية والاجتماعية؟”.

المصادر:

Microsoft, White House, and Allen Institute release coronavirus data set for medical and NLP researchers

With launch of COVID-19 data hub, the White House issues a ‘call to action’ for AI researchers

Over 24,000 coronavirus research papers are now available in one place

حساب تويتر

تابعوا حساب تويتر للمقالات باللغة الانجليزية.