Repositori ini berisi sampel kode yang akan memungkinkan peserta belajar cara menggunakan arsitektur berbasis router augmented generasi (RAG) dengan Amazon Bedrock dan Amazon OpenSearch Serverless (AOSS) untuk dengan cepat membangun asisten yang aman yang menggunakan informasi paling mutakhir untuk berkomunikasi dengan pengguna. Peserta juga akan belajar bagaimana asisten ini akan menggunakan pengambilan informasi yang dipandu dialog untuk menanggapi pengguna.
Amazon Bedrock adalah layanan yang dikelola sepenuhnya yang menawarkan pilihan model yayasan berkinerja tinggi (FMS) dari perusahaan AI terkemuka yang dapat diakses melalui API tunggal, bersama dengan serangkaian kemampuan yang luas yang Anda butuhkan untuk membangun aplikasi AI generatif, menyederhanakan pengembangan sambil mempertahankan privasi dan keamanan.
Model Bahasa Besar (LLM) adalah jenis model fondasi yang dapat menggunakan langauge alami sebagai input, dengan kemampuan untuk memproses dan memahaminya, dan menghasilkan bahasa alami sebagai output. LLMS juga dapat melakukan tugas -tugas seperti klasifikasi, ringkasan, penyederhanaan, pengenalan entitas, dll.
LLM biasanya dilatih secara offline dengan data yang tersedia sampai titik waktu itu. Akibatnya, LLM tidak akan memiliki pengetahuan tentang dunia setelah tanggal itu. Selain itu, LLM dilatih pada korpora domain yang sangat umum, membuatnya kurang efektif untuk tugas khusus domain. Dan kemudian, LLM memiliki kecenderungan untuk berhalusinasi di mana model menghasilkan teks yang salah, tidak masuk akal, atau tidak nyata. Menggunakan mekanisme pengambilan augment generasi (RAG) dapat membantu mengurangi semua masalah ini. Arsitektur Rag melibatkan pengambilan data yang sangat cocok dengan teks di prompt pengguna, dari sumber data eksternal, dan menggunakannya untuk menambah prompt sebelum mengirim ke LLM. Augmentasi prompt ini akan memberikan konteks yang dapat digunakan LLM untuk menanggapi prompt.
Ketika ada sumber data mulitple, ada kebutuhan untuk merutekan permintaan pengembalian ke sumber data yang sesuai sebelum melakukan pengambilan yang sebenarnya. Ini adalah pola router kain.
Repositori ini berisi kode yang akan memandu Anda melalui proses membangun asisten berbasis router canggih menggunakan model bahasa besar (LLM) yang di -host di Amazon Bedrock dan menggunakan basis pengetahuan untuk Amazon Bedrock untuk vektorisasi, menyimpan, dan mengambil data melalui pencarian semantik. Amazon OpenSearch Serverless akan digunakan sebagai indeks vektor.
py312_opensearch-py_requests_and_requests-aws4auth.zip menggunakan prosedur berikut dan mengunggahnya ke ember Amazon S3 yang sama seperti pada langkah 3.C:/Program Files/7-Zip/ .cd baru ke dalamnya.py312_opensearch-py_requests_and_requests-aws4auth.zip .cd baru ke dalamnya.py312_opensearch-py_requests_and_requests-aws4auth.zip .Repositori ini berisi
Notebook Jupyter untuk memulai.
Satu set fungsi pembantu untuk notebook
Diagram arsitektur yang menunjukkan berbagai komponen yang digunakan dalam sesi ini bersama dengan interaksi mereka.
Lihat berkontribusi untuk informasi lebih lanjut.
Perpustakaan ini dilisensikan di bawah lisensi MIT-0. Lihat file lisensi.