تَفَرُّد نت - Tafarud.net

غوغل تطلق مشروع Objectron لرصد الاجسام ثلاثية الابعاد في المشاهد ثنائية الابعاد

بالتزامن مع انطلاق قمة مطوري TensorFlow لعام 2020 ، طرحت شركة Google اليوم مشروع Objectron الذي يرصد الأشياء في الصور ثنائية الأبعاد ويقدر أوضاعها وأحجامها من خلال خوارزمية ذكاء اصطناعي. وفقاً للشركة فأن هذا المشروع سيكون له تأثير كبير على تطوير الروبوتات، والمركبات ذاتية القيادة، والبحث عن الصور، وتقنية الواقع المعزز، فعلى سبيل المثال يمكنها ان تساعد روبوت تنظيف أرضية المصنع على تجنب العقبات اثناء حركته. يعد تتبع الاشياء ثلاثية الأبعاد أمراً صعباً، خاصة عند التعامل مع معالجات محدودة القدرات (مثل شرائح معالجات الهواتف الذكية). ويصبح الأمر أكثر صعوبة عندما تكون البيانات او الصور المتاحة (والتي تكون عادة بشكل فيديو) ثنائية الأبعاد بسبب نقص البيانات و تنوع أشكال الأشياء.

ثم طور فريق Google المسؤول عن مشروع Objectron مجموعة أدوات لإحاطة الاشياء بمكعبات ثلاثية الأبعاد (ذات حدود مستطيلة). حيث تم وضع مكعبات محيطية ثلاثية الأبعاد فوق الاجسام إلى جانب السحب النقطية ومواضع الكاميرا في الفضاء وتحديد المجسمات المكتشفة. تم رسم هذه المكعبات المحيطية ثلاثية الأبعاد في فضاء عرض ثلاثي الأبعاد وتم التحقق من المواقع من خلال مراجعة الإسقاطات في إطارات مقاطع الفيديو ثنائية الأبعاد، وبالنسبة للمجسمات الثابتة، فقد تم إضافة رسم توضيحي للمجسم المستهدف في إطار واحد فقط.

بالاضافة الى البيانات الواقعية، طور الفريق برنامجاً يضع اجساماً افتراضية للمشهد من خلال تقنية الواقع المعزز AR من أجل تعزيز دقة واداء خوارزمية الذكاء الاصطناعي. سمح هذا باستخدام زوايا كاميرا مختلفة وكذلك مواضع متباينة لأسطح مستوية، ودرجت إضاءة متنوعة تتوافق مع المشهد، مما أدى إلى خلق بيانات اصطناعية عالية الجودة. وفي اختبارات التحقق من الأداء، زادت الدقة بحوالي 10٪ مع استخدام البيانات الاصطناعية.

وفوق كل ذلك فإن الإصدار الحالي من مشروع Objectron صغير الحجم بما يكفي لتشغيله بكفاءة على الأجهزة المحمولة. فبفضل شريحة معالج الرسوم Adreno 650 والموجودة في الهواتف الحديثة مثل LG V60 ThinQ و Samsung Galaxy S20، يمكن لهذه الاجهزة معالجة حوالي 26 إطاراً في الثانية الواحدة. يتوفر برنامج Objectron من خلال منصة MediaPipe، وهي منصة عمل لبناء أنظمة الذكاء الاصطناعي للاستدلال السريع ومعالجة الوسائط المتعددة (مثل فك تشفير مقاطع الفيديو). تتوفر حاليا خوارزميات نماذج مدربة للتعرف على الأحذية والكراسي، بالإضافة إلى تطبيق تجريبي. ويخطط فريق العمل لمشاركة حلول إضافية في المستقبل، تخدم مجتمع البحث والتطوير، وينوي كذلك توسيع نطاق عمل نموذج Objectron ليشمل المزيد من فئات المجسمات وتحسين أدائه.

المصادر:

Real-Time 3D Object Detection on Mobile Devices with MediaPipe

Google’s Objectron uses AI to track 3D objects in 2D video

Google Has Developed a New 3D Object Recognition Process, Which Could Lead to Improved AR Experiences

حساب تويتر

تابعوا حساب تويتر للمقالات باللغة الانجليزية.