من EPFL نموذج جديد متعدد الوسائط لمزيد من مرونة الذكاء الاصطناعي

ويمكنه التعلم من النصوص والصور والفيديو والصوت، وبفضل نمطيته، ينتج أي عدد أو مجموعة من التنبؤات

التعلم الآلي: نموذج جديد متعدد الوسائط لذكاء اصطناعي أكثر مرونة من EPFL
من EPFL نموذج جديد متعدد الوسائط لذكاء اصطناعي أكثر مرونة (الصورة: Brian Penny/Pixabay)

سواء كنا نتحدث عن OpenAI أو ChatGPT، فإن الغالبية العظمى من برامج الدردشة الآلية الذكاء الاصطناعي التوليدي تعتمد على ما يسمى نموذج اللغة الكبير (LLM)، نماذج من التعلم العميق تم تدريبهم على نطاق واسع على تقديم إجابات للأسئلة المطروحة عليهم من خلال تعلم المعلومات من خلال كميات كبيرة من النصوص.

الحدود الأخيرة لالذكاء الاصطناعي التوليدي هي نماذج متعددة الوسائط، والتي تجمع بين فهم اللغة والصور والفيديو والصوت لتقديم تجربة وخدمة أكثر تقدمًا.

ومع ذلك، فإن إنشائها يطرح العديد من التحديات، خاصة إذا كانت النية هي بناء نماذج متعددة الوسائط على نطاق صغير: وجود البيانات المفقودة بسبب عدم توفر المعلومات، وغالبًا ما يكون ذلك بسبب التوافر الجزئي للموارد.

باختصار، يكمن الخطر في أن النموذج يتعلم على أساس النقص، وأن تكون الحسابات والتنبؤات مشوهة. وهنا بدأ EPFL بمشروعه الجديد.

من جامعة لوزان التقنية وزيورخ تحالف للطاقة الخضراء
في 3D ، القفاز التكنولوجي الذي سيجعل الواقع الافتراضي ملموسًا

تعلم آلة
حرم الكلية التقنية الفيدرالية في لوزان (الصورة: Facebook/EFPL)

MultiModN، النموذج المعياري المتعدد الوسائط الذي ولد في لوزان

الباحثون في البوليتكنيك الفيدرالي في لوزان (EPFL) وهي من أفضل الجامعات في العالم من حيث الهندسة وتكنولوجيا المعلومات، فقد تطورت بالفعل مولتيمودن، نموذج فريد متعدد الوسائط تم تقديمه مؤخرًا في NeurIPS2023.

قرر باحثون من التعلم الآلي للتعليم (ML4ED) ومختبرات التعلم الآلي والتحسين (MLO) في كلية علوم الكمبيوتر والاتصالات في EPFL تطوير واختبار العكس تمامًا من الحجم الكبير، ولكن على نطاق أصغر.

بقيادة المعلم ماري آن هارتلي، مدير مختبر تقنيات الصحة الذكية العالمية الذي تم استضافته بشكل مشترك في MLO وكلية الطب بجامعة ييل، وأستاذ تانيا كاسر، مدير ML4ED، أنشأ الفريق نموذجًا متعدد الوسائط يمكنه التعلم من النصوص والصور ومقاطع الفيديو والأصوات ولكنه، على عكس النماذج الموجودة، يتكون من عدد متغير من الوحدات الأصغر، مستقلة ومدخلات محددة.

يمكن اختيار الأخير بناءً على المعلومات المتاحة ثم تجميعه معًا في تسلسل لأي رقم أو مجموعة أو نوع من المدخلات. وبالتالي يمكنها إنتاج أي عدد أو مجموعة من التنبؤات.

"قمنا بتقييم MultiModN في عشرة أنشطة حقيقية، بما في ذلك دعم التشخيص الطبي والتنبؤ بالأداء الأكاديمي والتنبؤ بالطقس. وأوضح فينيترا سوامي، طالب دكتوراه في ML4ED وMLO والمؤلف المشارك الأول للمشروع.

"من خلال هذه التجارب، نعتقد أن MultiModN هو أول نهج قابل للتفسير بشكل جوهري ومقاوم لفقدان البيانات للنمذجة متعددة الوسائط".

"وصفة" EPFL لأجهزة الكمبيوتر الكمومية الأكثر قوة
من الذكاء الاصطناعي دفعة حاسمة للعملات المشفرة؟

تعلم آلة
مدرسة EPFL لعلوم الكمبيوتر والاتصالات (الصورة: Facebook/EPFL IC)

حالة الاستخدام الأولى: القرارات السريرية للعاملين في المجال الطبي

ستكون حالة الاستخدام الأولى لـ MultiModN بمثابة نظام دعم لـ القرارات السريرية للعاملين في المجال الطبي في البيئات المحدودة الموارد.

في الواقع، في قطاع الرعاية الصحية، غالبًا ما تكون البيانات السريرية مفقودة، ربما بسبب محدودية الموارد (لا يستطيع المريض تحمل تكلفة اختبار معين) أو على العكس من ذلك، بسبب وفرة الموارد والمعلومات. MultiModN قادر على التعلم من هذه البيانات الواقعية دون استيعاب ما يسمى بالتحيزات، وتكييف التنبؤات مع أي مجموعة أو عدد من المدخلات.

"تعتبر البيانات المفقودة سمة مميزة في السياقات المحدودة الموارد، وعندما تتعلم النماذج هذه الأنماط المفقودة، يمكنها تشفير الأخطاء في تنبؤاتها. وشدد ماري آن هارتلي.

"إن الحاجة إلى المرونة في مواجهة الموارد المتاحة التي لا يمكن التنبؤ بها هي ما ألهم MultiModN".

ومن أهم الأحداث تأثير الذكاء الاصطناعي والتعلم الآلي على الخدمات
كل أسباب التأثير المتزايد للذكاء الاصطناعي في الفن الرقمي

تعلم آلة
معمل تحليل (الصورة: ميشال جارمولوك/بيكساباي)

من المختبر إلى الحياة الواقعية: تجري حاليًا تجربة على الالتهاب الرئوي والسل

ومع ذلك، فإن النشر ليس سوى الخطوة الأولى نحو التنفيذ والاختبار الميداني. عمل البروفيسور هارتلي مع زملائه في مستشفى جامعة لوزان (CHUV) وInselspital، مستشفى برن الجامعي، لإجراء الدراسات السريرية تركز على تشخيص الالتهاب الرئوي والسل في البيئات المحدودة الموارد، وهي بصدد تجنيد آلاف المرضى سود أفريقيا, تنزانيا, ناميبيا e بنين.

قامت مجموعات البحث بمبادرة تدريب واسعة النطاق والتدريس أكثر من أطباء 100 لجمع البيانات متعددة الوسائط بشكل منهجي بما في ذلك الصور ومقاطع الفيديو بالموجات فوق الصوتية، بحيث يمكن تدريب MultiModN ليكون حساسًا للبيانات الحقيقية من المناطق منخفضة الموارد.

"نحن نجمع بالضبط نوع البيانات المعقدة متعددة الوسائط التي تم تصميم MultiModN للتعامل معها"قال الطبيب نويمي بويلات بلانكو، أخصائي الأمراض المعدية في CHUV.

"نحن متحمسون لرؤية نموذج يمكنه تقدير تعقيد الموارد المفقودة في سياقاتنا والافتقار المنهجي للتقييمات السريرية الروتينية"وأضاف الطبيب كريستينا كيتل من مستشفى Inselspital الجامعي في العاصمة السويسرية.

سلامة الذكاء الاصطناعي؟ إن بيان بليتشلي بارك أمر بالغ الأهمية
محور Axel Springer-OpenAI للذكاء الاصطناعي في خدمة الصحافة

تم تصميم ابتكار EPFL لتحسين عملية اتخاذ القرارات السريرية من خلال توفير الوصول إلى المعرفة الطبية المتخصصة (الصورة: Irwan/Unsplash)

التعلم الآلي في خدمة الصالح العام

يمثل تطوير وتدريب MultiModN استمرارًا لجهود EPFL لتكييف أدوات التعلم الآلي مع الواقع ومن أجل الصالح العام، ويأتي بعد وقت قصير من إطلاق ميديترونوهو نموذج ذكاء اصطناعي مصمم خصيصًا للقطاع الطبي.

ينتمي Meditron أيضًا إلى فئة نماذج اللغات الكبيرة (LLM)، ولكن على عكس النماذج العامة، التي تخدم مجموعة واسعة من المهام، فإنه يركز على المجال الطبي، وهو أكثر إحكاما من حيث الحجم، ولكنه فعال بنفس القدر.

هدف Meditron هو ديمقراطية الوصول إلى المعلومات الطبية ذات جودة عالية، مما يساعد في اتخاذ القرارات السريرية.

طور باحثو EPFL نسختين تحتويان على 7 مليار و70 مليار معلمة على التوالي، وتم تدريب النماذج على مصادر بيانات طبية مختارة وعالية الجودة، بما في ذلك الأدبيات العلمية التي راجعها النظراء ومبادئ توجيهية سريرية مختلفة، مما يضمن قاعدة معرفية واسعة ودقيقة.

وبالتالي فإن كلاً من Meditron، الذي تم تقديمه في نوفمبر 2023، وMultiModN يتماشى مع مهمة مركز الذكاء الاصطناعي الجديد التابع لـ EPFL، والذي يركز على كيفية قيام الذكاء الاصطناعي المسؤول والفعال بتعزيز الابتكار التكنولوجي لصالح جميع قطاعات المجتمع.

أجهزة الاستشعار الثورية التي يمكنها توفير ملايين البطاريات
منظمة العفو الدولية: الحرب التي على وشك أن تندلع لن تكون كما نتوقع..

التعلم الآلي: نموذج جديد متعدد الوسائط لذكاء اصطناعي أكثر مرونة من EPFL
الجزء الخارجي من حرم EPFL الذي يحمل شعار الكلية التقنية الفيدرالية في لوزان (الصورة: Facebook/EFPL IC)