أظهر نموذج Gemini Large Language Model (LLM) من Google إمكانات مذهلة خلال ستة أشهر فقط، خاصة في مجال الصحة. تم تصميم نموذجها المشتق، PH-LLM، لمعالجة بيانات الأجهزة القابلة للارتداء ويتفوق حتى على الخبراء المتمرسين في توصيات النوم واللياقة البدنية. سوف تتعمق هذه المقالة في الأداء المتميز لـ PH-LLM وقيوده واتجاهات التطوير المستقبلية.
يبلغ عمر نموذج Gemini من Google ستة أشهر فقط وقد أظهر بالفعل قدرات رائعة في مجالات الأمان والتشفير وتصحيح الأخطاء وغيرها من المجالات. ومع ذلك، فقد تفوق هذا النموذج اللغوي الكبير (LLM) على البشر في توصيات النوم واللياقة البدنية. كشف الباحثون في Google عن نموذج اللغة الكبيرة للصحة الشخصية (PH-LLM)، وهو نسخة مضبوطة بدقة من Gemini يمكنها فهم البيانات الصحية الشخصية المتسلسلة زمنيًا والتفكير فيها من الأجهزة القابلة للارتداء مثل الساعات الذكية وأجهزة مراقبة معدل ضربات القلب. وفي تجاربهم، أجاب النموذج على الأسئلة وتنبأ بها بشكل أفضل بكثير من الخبراء الذين لديهم سنوات من الخبرة في مجال الصحة واللياقة البدنية.

يمكن للتكنولوجيا القابلة للارتداء أن تساعد الأشخاص على مراقبة صحتهم، ومن الناحية المثالية، إجراء تغييرات ذات معنى. توفر الأجهزة "مصدرًا غنيًا وطويل الأمد للبيانات" يمكن الحصول عليه "بشكل سلبي ومستمر" من مدخلات مثل سجلات التمارين والطعام، ومذكرات الحالة المزاجية، وأحيانًا حتى نشاط وسائل التواصل الاجتماعي. ومع ذلك، نادرًا ما يتم دمج البيانات التي يجمعونها حول النوم والنشاط البدني وصحة القلب والتمثيل الغذائي والضغط النفسي في الإعدادات السريرية "المجزأة". ويتوقع الباحثون أن هذا يرجع على الأرجح إلى أنه يتم التقاط البيانات مع عدم وجود سياق ويتطلب الكثير من الحوسبة لتخزينها وتحليلها. بالإضافة إلى ذلك، قد يكون تفسير هذه البيانات أمرًا صعبًا.
ومع ذلك، حقق الباحثون في Google اختراقات في تدريب نماذج PH-LLM لتقديم التوصيات، والإجابة على أسئلة الامتحانات المهنية، والتنبؤ باضطرابات النوم ونتائج اضطرابات النوم المبلغ عنها ذاتيًا. تم إعطاء النموذج أسئلة متعددة الخيارات، واستخدم الباحثون أيضًا "تسلسل الأفكار" (تقليد المنطق البشري) وطرق "الصفر" (تحديد الأشياء والمفاهيم التي لم يتم مواجهتها سابقًا).
ومن المثير للإعجاب أن PH-LLM حققت درجة 79% في اختبار النوم و88% في اختبار اللياقة البدنية، وكلاهما تجاوز متوسط درجات عينة من مجموعات الخبراء البشريين، بما في ذلك خمسة مدربين رياضيين محترفين (متوسط الخبرة 13.8 عامًا) و خمسة أخصائيين في طب النوم (متوسط الخبرة 25 سنة). وكان متوسط درجات الخبراء البشريين فيما يتعلق باللياقة البدنية والنوم 71% و76% على التوالي.
وأشار الباحثون إلى أنه "في حين أن هناك حاجة إلى مزيد من التطوير والتقييم في مجال الصحة الشخصية، فإن هذه النتائج تظهر قاعدة المعرفة الواسعة وقدرات نموذج جيميني".
لتحقيق هذه النتائج، قام الباحثون أولاً بإنشاء وتنسيق ثلاث مجموعات بيانات لاختبار الرؤى والتوصيات الشخصية من الأجهزة القابلة للارتداء، وخبرة المجال، والتنبؤات بجودة النوم المبلغ عنها ذاتيًا. لقد عملوا مع خبراء المجال لإنشاء 857 دراسة حالة تمثل سيناريوهات واقعية في مجالات النوم واللياقة البدنية. تستخدم مشاهد النوم مقاييس فردية لتحديد العوامل الأساسية وتقديم توصيات مخصصة للمساعدة في تحسين جودة النوم. تستخدم مهام اللياقة البدنية معلومات من التدريب والنوم والمقاييس الصحية وتعليقات المستخدمين لوضع توصيات بشأن كثافة النشاط البدني ليوم معين.
تتضمن كلتا دراستي الحالة بيانات أجهزة الاستشعار القابلة للارتداء، بما في ذلك بيانات النوم لمدة تصل إلى 29 يومًا وبيانات اللياقة البدنية لأكثر من 30 يومًا، إلى جانب المعلومات الديموغرافية (العمر والجنس) وتحليل الخبراء.
على الرغم من أن الباحثين لاحظوا أن PH-LLM هي مجرد البداية، مثل أي تقنية ناشئة، إلا أنها لا تزال لديها بعض المشكلات التي يجب حلها. على سبيل المثال، لا تكون الاستجابات الناتجة عن النموذج متسقة دائمًا، وهناك وهم حول "اختلاف كبير" في دراسات الحالة، ويبدو برنامج LLM أحيانًا محافظًا أو حذرًا في ردوده. في دراسة حالة اللياقة البدنية، كان النموذج حساسًا جدًا للإفراط في التدريب، وفي إحدى الحالات، لاحظ الخبراء البشريون أنه فشل في تحديد الأسباب المحتملة للإصابة بسبب الحرمان من النوم. بالإضافة إلى ذلك، تغطي دراسات الحالة على نطاق واسع مجموعة متنوعة من التركيبة السكانية والأفراد النشطين نسبيًا، وبالتالي قد لا تمثل السكان بشكل كامل أو تعالج مشكلات النوم واللياقة البدنية على نطاق أوسع.
في الختام، فإن تطبيق PH-LLM في مجال الصحة الشخصية يُظهر إمكانات كبيرة ولكنه لا يزال بحاجة إلى مزيد من التحسين. يجب أن تركز الأبحاث المستقبلية على اتساقها وقوتها وإمكانية تطبيقها على عدد أكبر من السكان لضمان تطبيقها الآمن والفعال في السيناريوهات الفعلية.