يتيح هذا المشروع ضبط وخدمة نماذج الذكاء الاصطناعي المفرطة للشخصية على نطاق واسع على AWS. نلبي احتياجات مقدمي خدمات SaaS والشركات الناشئة B2C التي تتطلع إلى التوسع بسرعة. نقترح بنية تعزز Amazon Sagemaker لتبسيط صياغة النموذج النموذجية والنشر ، وتمكين التطوير بشكل أسرع ، وتحسين جودة الخدمة ، وفعالية التكلفة ؛ ونقاط النهاية متعددة النماذج (MMEs) للاستضافة في الوقت الفعلي ، والتي توفر طريقة قابلة للتطوير ومنخفضة التكاليف وفعالة من حيث التكلفة لنشر آلاف نماذج التعلم العميق خلف نقطة نهاية واحدة. لمزيد من التفاصيل ، يرجى الرجوع إلى منشور المدونة هذا.
npm install -g aws-cdkhttps://python-poetry.org/docs/#installationتثبيت الشعر Linux ، MacOS ، Windows (WSL)
curl -sSL https://install.python-poetry.org | python3 -تثبيت التبعيات مع الشعر
poetry install
الإعداد Python Env in Shell
poetry shell
في هذه المرحلة ، يمكنك الآن توليف قالب CloudFormation لهذا الرمز.
$ cdk synth
لإضافة تبعيات إضافية ، على سبيل المثال مكتبات CDK أخرى ، ما عليك سوى استخدام poetry add yourpackage
cdk ls جميع المداخن في التطبيقcdk synth قالب cloudformation المركبcdk deploy نشر هذا المكدس على حساب/منطقة AWS الافتراضيةcdk diff مقارنة المكدس المنشور مع الحالة الحاليةcdk docs مفتوح وثائق CDK تتضمن البنية الموصوفة نظامًا لحالات استخدام الذكاء الاصطناعى التوليدي ، مع التركيز على توليد نص إلى نص مخصص كمثال ، باستخدام انتشار مستقر V2-1. المكونات الرئيسية لهذه الهندسة المعمارية هي كما يلي:
Sagemaker التدريب واستضافة واجهات برمجة التطبيقات : توفر واجهات برمجة التطبيقات هذه وظائف التدريب المدارة بالكامل وقدرات النشر النموذجية. أنها تمكن الفرق سريعة الحركة من التركيز أكثر على ميزات المنتج والتمايز. تعتبر وظائف التدريب في Sagemaker ، التي تتبع نموذج "الإطلاق والناشئ" مناسبة لوظائف صقل النماذج المتزامنة العابرة أثناء استخدام المستخدم.
استضافة GPU المدعومة : يدعم Sagemaker خيارات الاستضافة التي تدعم GPU لنشر نماذج التعلم العميق على نطاق واسع. يتضمن ذلك تكامل خادم الاستدلال Nvidia Triton في النظام البيئي Sagemaker. تقدم Sagemaker أيضًا دعم GPU لنقاط النهاية متعددة الطراز (MMEs) ، والتي تسمح بنشر الآلاف من نماذج التعلم العميق خلف نقطة نهاية واحدة ، وضمان قابلية التوسع ، والكلية المنخفضة ، وفعالية التكلفة.
مستوى البنية التحتية : على مستوى البنية التحتية ، تعتمد الهندسة المعمارية على أفضل خيارات حساب في فئتها ، مثل نوع مثيل G5 ، المجهز بـ NVIDIA A10G TENSOR CORE GPU (فريدة من نوعها لـ AWS). يوفر نوع المثيل هذا نسبة مواتية لأداء الأسعار لكل من التدريب والاستضافة النموذجية ، مما يوفر طاقة حسابية فعالة لكل دولار تنفق.
الهندسة المعمارية مناسبة بشكل خاص لحالات استخدام توليد النص إلى صورة. يقسم سير عمل الحل إلى مرحلتين رئيسيتين:
المرحلة A (المستخدم على متن الطائرة) : في هذه المرحلة ، يمكن للمستخدمين طلب إنشاء طرز واحدة أو أكثر من المخصصات المخصصة. يمكنهم التحقق من حالة توافر نماذجهم في جميع الأوقات ، لمعرفة متى ينتهي التدريب.
المرحلة B (الاستدلال عند الطلب) : بعد الضبط الدقيق ، يكون النموذج جاهزًا لتوليد الصور في الوقت الفعلي عند الطلب من قبل المستخدمين النهائيين.

للتفاعل مع بوابة API التي تم نشرها باستخدام AWS CDK ، اتبع هذه الخطوات:
افتح ساعي البريد واستيراد المجموعة من documentation المجلد.
قم بتعيين طريقة الطلب (على سبيل المثال ، Get ، Post) وأدخل نقطة نهاية URL Gateway API.
إذا كانت واجهة برمجة التطبيقات الخاصة بك تتطلب المصادقة ، فقم بتكوين الرؤوس أو الرموز اللازمة.
أضف أي معلمات أو بيانات طلب مطلوبة.
انقر فوق "إرسال" لتقديم الطلب واستلام الرد.
ملاحظة: تأكد من تكوين موارد AWS و API بشكل صحيح للتعامل مع الطلب.