
Proyek ini adalah tutorial tentang model bayi Cina eksklusif untuk model open source, untuk pemula domestik dan berdasarkan platform Linux. Ini memberikan panduan proses penuh untuk berbagai model open source termasuk konfigurasi lingkungan, penyebaran lokal, penyempurnaan yang efisien dan keterampilan lainnya, menyederhanakan penyebaran, penggunaan dan proses aplikasi model open source, memungkinkan lebih banyak siswa dan peneliti yang lebih biasa untuk menggunakan model open source dengan lebih baik, membantu open source dan model gratis untuk mengintegrasikan kehidupan pelajar biasa lebih cepat.
Isi utama dari proyek ini meliputi:
Konten utama dari proyek ini adalah tutorial, sehingga lebih banyak siswa dan praktisi masa depan dapat memahami dan membiasakan diri dengan metode makan model besar open source! Siapa pun dapat mengusulkan masalah atau mengirimkan PR untuk bersama -sama membangun dan memelihara proyek ini.
Siswa yang ingin berpartisipasi secara mendalam dapat menghubungi kami dan kami akan menambahkan Anda ke pengelola proyek.
Saran Pembelajaran: Saran pembelajaran untuk proyek ini adalah untuk terlebih dahulu mempelajari konfigurasi lingkungan, kemudian mempelajari penyebaran dan penggunaan model, dan akhirnya belajar menyempurnakan. Karena konfigurasi lingkungan adalah dasar, penyebaran dan penggunaan model adalah dasar, dan penyempurnaan diserahkan. Pemula dapat memilih QWEN1.5, Internlm2, MiniCPM dan model lain untuk memprioritaskan pembelajaran.
Catatan: Jika siswa ingin memahami komposisi model model besar dan menulis tugas seperti Rag, Agen dan Eval dari awal, mereka dapat mempelajari proyek lain dari DataWhale. Big Model adalah topik hangat di bidang pembelajaran mendalam saat ini, tetapi sebagian besar tutorial model besar yang ada hanya untuk mengajarkan Anda cara memanggil API untuk menyelesaikan penerapan model besar, dan beberapa orang dapat menjelaskan struktur model, kain, agen, dan evaluasi dari tingkat prinsip. Oleh karena itu, repositori akan memberikan semua tulisan tangan dan tidak menggunakan bentuk memanggil API untuk menyelesaikan tugas kain, agen, dan evaluasi dari model besar.
CATATAN: Mempertimbangkan bahwa beberapa siswa berharap untuk mempelajari bagian teoritis dari model besar sebelum mempelajari proyek ini, jika mereka ingin mempelajari lebih lanjut dasar teoritis LLM dan lebih memahami dan menerapkan LLM berdasarkan teori, mereka dapat merujuk pada kursus yang begitu besar Datawhale.
Catatan: Jika ada siswa yang ingin mengembangkan aplikasi model besar sendiri setelah mempelajari kursus ini. Siswa dapat merujuk pada kursus pengembangan aplikasi model besar DataWhale, yang merupakan tutorial pengembangan aplikasi model besar untuk pemula. Ini bertujuan untuk sepenuhnya menyajikan proses pengembangan aplikasi model besar kepada siswa berdasarkan Alibaba Cloud Server dan dikombinasikan dengan proyek asisten basis pengetahuan pribadi.
Apa itu model besar?
Model besar (LLM) secara sempit mengacu pada model pemrosesan bahasa alami (NLP) yang dilatih berdasarkan algoritma pembelajaran yang mendalam. Mereka terutama digunakan di bidang seperti pemahaman dan generasi bahasa alami. Dalam arti luas, mereka juga termasuk model besar Machine Vision (CV), model besar multimodal dan model besar komputasi ilmiah.
Pertempuran ratusan model sedang berjalan lancar, dan Open Source LLMS muncul satu demi satu. Saat ini, banyak llms open source yang sangat baik telah muncul di rumah dan di luar negeri, seperti Llama dan Alpaca, dan di dalam negeri, seperti Chatglm, Baichuan, Internlm (Cendekia Puyu), dll. Open Source LLM mendukung penyebaran pengguna lokal dan penyesuaian domain pribadi. Setiap orang dapat membuat model besar mereka sendiri yang unik berdasarkan Open Source LLM.
Namun, jika siswa dan pengguna biasa ingin menggunakan model besar ini, mereka perlu memiliki kemampuan teknis tertentu untuk menyelesaikan penyebaran dan penggunaan model. Untuk LLMS open source yang muncul satu demi satu, ini adalah tugas yang relatif menantang untuk dengan cepat menguasai metode aplikasi LLM open source.
Proyek ini bertujuan untuk pertama-tama mewujudkan tutorial penyebaran, penggunaan, dan penyempurnaan dari LLM Open Source utama di dalam dan luar negeri berdasarkan pengalaman kontributor inti; Setelah mewujudkan bagian-bagian yang relevan dari LLM utama, kami berharap dapat sepenuhnya mengumpulkan co-pencipta untuk memperkaya dunia Open Source LLM ini dan membuat tutorial yang lebih komprehensif untuk LLM khusus. Percikan bertitik, berkumpul ke laut.
Kami berharap menjadi tangga bagi LLM dan masyarakat umum, dan merangkul dunia LLM yang lebih megah dan luas dengan semangat open source dari kebebasan dan kesetaraan.
Proyek ini cocok untuk pelajar berikut:
Proyek ini berencana untuk mengatur seluruh proses aplikasi LLM open source, termasuk konfigurasi dan penggunaan lingkungan, penyebaran dan aplikasi, fine-tuning, dll. Setiap bagian mencakup arus utama dan fitur open source LLM:
Chat-Huanhuan: Chat-Zhen Huan adalah model bahasa obrolan yang meniru nada Zhen Huan menggunakan semua baris dan kalimat tentang Zhen Huan dalam skrip "The Legend of Zhen Huan" dan penyesalan berdasarkan LLM.
Tianji: Tianji adalah skenario sosial yang didasarkan pada perasaan manusia dan gaya duniawi, mencakup seluruh proses rekayasa kata yang cepat, produksi tubuh cerdas, akuisisi data, dan penyesuaian model, pembersihan dan penggunaan data kain, dll.
Qwen2.5-Coder
QWEN2-VL
Qwen2.5
Apple Openelm
Llama3_1-8b-instruct
GEMMA-2-9B-IT
Yuan2.0
Yuan2.0-m32
Deepseek-Coder-V2
Bilibili Index-1.9b
Qwen2
GLM-4
Qwen 1.5
Google - Gemma
phi-3
Karakterglm-6b
Llama3-8b-instruct
Xverse-7b-chat
Transnormerllm
Model Bluelm Vivo Blue Heart
Internlm2
Pencarian mendalam mendalam
Minicpm
Qwen-audio
Qwen
Seribu hal
Baichuan Intelligent
Internlm
Atom (llama2)
Chatglm3
Pip, sumber perubahan conda @ tidak memiliki bawang, jahe, bawang putih
Autodl open port @jangan pedas jahe dan bawang putih
Download model
Masalah && pr
Catatan: Peringkat diurutkan berdasarkan tingkat kontribusi
