Dieses Repository bietet eine Sammlung generativer KI -Engineering -Notizbücher, die demonstrieren, wie Amazon Sagemaker JumpStart SDK verwendet wird, um große Sprachmodelle (LLMs) anzupassen. Die Notizbücher zeigen mit den Falcon-Modellvarianten, wie grundlegende Ebenen der Inferenzanpassung angewendet werden, z. Die Notizbücher sind so konzipiert, dass sie leicht bereit sind und zu folgen sind und sie zu einer guten Ressource für die LLM -Inferenzanpassung machen können.
Die folgenden Amazon Sagemaker Studio -Notizbücher sind in diesem Repository erhältlich:
LLM-Custom-Decoding-Falcon40B-G5.ipynb zeigt, wie man Text mit verschiedenen Dekodierungsstrategien mit dem Amazon Sagemaker Jumpstart SDK und Falcon-40B-Instruct-Modell generiert.LLM-Custom-Prompting-Falcon40B.ipynb zeigt, wie man Text mit dem Amazon Sagemaker JumpStart SDK und Falcon-40B-Modell erstellt.LLM-Custom-RAG-Kendra-Falcon40B.ipynb zeigt, wie Sagemaker und Boto3 SDKs verwendet werden, um Text unter Verwendung des RAG-Musters (Retrieval-Augmented Generation) zu generieren. Das Notebook implementiert die semantische Suche mit Amazon Kendra Enterprise Search Service. Das für die Textgenerierung verwendete Sprachmodell ist Falcon-40B-Instruktur.Um ein Jupyter -Notizbuch mit Amazon Sagemaker zu öffnen, sollten Sie die beiden folgenden Schritte berücksichtigen:
Weitere Informationen finden Sie unter Beitrag.
Diese Bibliothek ist im Rahmen der MIT-0-Lizenz lizenziert. Siehe die Lizenzdatei.