تعليم السيارات ذاتية القيادة للتنبؤ بحركة المشاة

من خلال التركيز على مشاعر البشر ، وتماثل الجسم ووضع القدم ، يقوم باحثو جامعة ميشيغان بتعليم السيارات ذاتية القيادة للتعرف على حركات المشاة والتنبؤ بها بدقة أكبر من التقنيات الحالية.

تسمح البيانات التي تجمعها المركبات من خلال الكاميرات ، و LiDAR و GPS للباحثين بالتقاط مقتطفات الفيديو للبشر في الحركة ثم إعادة إنشائها في محاكاة الكمبيوتر ثلاثية الأبعاد. مع ذلك ، أنشأوا "شبكة عصبية متكررة مستوحاة بيوميكانيكيا" التي تذيع الحركات البشرية.

مع ذلك ، يمكنهم التنبؤ بالمواقع ومواقع المستقبل لواحد أو أكثر من المشاة تصل إلى حوالي 50 ياردة من السيارة. هذا حول نطاق تقاطع المدينة.

وقال رام فاسوديفان ، الأستاذ المساعد في الهندسة الميكانيكية في جامعة ميتشجان ، "عمل سابق في هذا المجال لم ينظر عادة إلا في الصور الثابتة. لم يكن مهتما حقا بكيفية تحرك الناس في ثلاثة أبعاد". "ولكن إذا كانت هذه السيارات ستعمل وتتفاعل في العالم الحقيقي ، فإننا نحتاج إلى التأكد من أن توقعاتنا حول مكان سير المشاة لا تتطابق مع المكان الذي ستذهب إليه السيارة بعد ذلك".

إن تزويد السيارات بالقدرة التنبؤية اللازمة يتطلب من الشبكة الغوص في تفاصيل الحركة البشرية: سرعة المشية البشرية (دورية) ، وتناظر المرآة للأطراف ، والطريقة التي يؤثر بها وضع القدم على الثبات أثناء المشي.

وقد تعامل الكثير من التعلم الآلي المستخدم في جلب التكنولوجيا المستقلة إلى مستواها الحالي مع صور ثنائية الأبعاد – صور ثابتة. في النهاية ، سيظهر جهاز كمبيوتر يظهر عدة ملايين من صور علامة التوقف للتعرف على علامات التوقف في العالم الحقيقي وفي الوقت الفعلي.

ولكن باستخدام مقاطع الفيديو التي تعمل لعدة ثوان ، يمكن لنظام U-M دراسة النصف الأول من المقتطف لإجراء تنبؤاته ، ومن ثم التحقق من الدقة في النصف الثاني.

"الآن ، نحن نقوم بتدريب النظام على التعرف على الحركة والتنبؤ ليس فقط بشيء واحد – سواء كان علامة توقف أم لا – ولكن عندما يكون جسد المشاة في الخطوة التالية والتالية التالية ، "ماثيو جونسون-روبرسون ، أستاذ مشارك في قسم الهندسة المعمارية البحرية والهندسة البحرية في جامعة أم.

ولتفسير نوع الاستقراءات التي يمكن للشبكة العصبية القيام بها ، يصف فاسودافان المشاهد الشائعة.

وقال فاسوديفان: "إذا كان أحد المشاة يلعب بهاتفه ، فأنت تعرف أنه مشغول". "إن موقفهم وأين ينظرون إليه هو إخباركم كثيرًا عن مستوى انتباههم. كما أنه يخبركم كثيرًا عما يمكنهم فعله بعد ذلك".

وقد أظهرت النتائج أن هذا النظام الجديد يتحسن عند قدرة مركبة بدون سائق على التعرف على ما هو أكثر احتمالا أن يحدث بعد ذلك.

وقال جونسون-روبرسون "كان خطأ الترجمة المتوسطة في توقعاتنا حوالي 10 سم بعد ثانية واحدة وأقل من 80 سم بعد ست ثوان. جميع طرق المقارنة الأخرى كانت تصل إلى سبعة أمتار." "نحن أفضل في معرفة أين سيكون الشخص."

للحد من عدد الخيارات للتنبؤ بالحركة التالية ، طبق الباحثون القيود المادية لجسم الإنسان – عدم قدرتنا على الطيران أو أسرع سرعة ممكنة على الأقدام.

لإنشاء مجموعة البيانات المستخدمة لتدريب الشبكة العصبية U-M ، أوقف الباحثون سيارة ذات ملامح مستقلة من المستوى 4 في العديد من تقاطعات آن آربور. ومع وجود كاميرات السيارة واليدار أمام التقاطع ، يمكن أن تسجل المركبة عدة أيام من البيانات في كل مرة.

عزز الباحثون ذلك العالم الحقيقي ، "في البرية" البيانات من مجموعات البيانات التقليدية التي تم التقاطها في المختبر. والنتيجة هي نظام من شأنه أن يرفع مستوى ما تستطيع المركبات التي تعمل بدون سائق.

"نحن منفتحون على التطبيقات المتنوعة وفرص التعاون متعددة التخصصات المثيرة ، ونأمل في خلق والمساهمة في بيئة معيشية أكثر أمانا وصحة ، وأكثر كفاءة" ، وقال مهندس أبحاث U-M Xiaoxiao دو.

مصدر القصة:

المواد المقدمة من قبل جامعة ميشيغان. ملاحظة: يمكن تعديل المحتوى للأسلوب والطول.