[Warisan]
Repositori ini sekarang dalam fase warisan dan tidak lagi dipertahankan secara aktif. Meskipun kode sumber masih tersedia dalam riwayat git, tidak akan ada pembaruan tambahan atau dukungan resmi.
[Tentang Nebuly]
Tim kami berkomitmen penuh untuk menciptakan platform pengalaman pengguna terbaik untuk LLMS sehingga perusahaan dapat memahami perilaku pengguna pada skala saat berinteraksi dengan produk berbasis LLM mereka.
[Tentang optimat]
Kami telah bersumber terbuka beberapa proyek internal kepada masyarakat, tetapi saat ini kami tidak memeliharanya. Optimate adalah kumpulan perpustakaan yang dirancang untuk membantu Anda mengoptimalkan model AI Anda. Ini adalah proyek open-source yang dikembangkan oleh Nebuly AI tetapi tidak dipertahankan secara aktif .
Alat yang tersedia untuk membantu Anda dalam optimasi Anda adalah:
✅ Speedster: Kurangi biaya inferensi dengan memanfaatkan teknik optimasi SOTA yang terbaik memasangkan model AI Anda dengan perangkat keras yang mendasarinya (GPU dan CPU)
✅ NOS: Kurangi biaya infrastruktur dengan memanfaatkan partisi dinamis real-time dan kuota elastis untuk memaksimalkan pemanfaatan kluster GPU Kubernetes Anda
✅ Chatllama: Kurangi biaya perangkat keras dan data dengan memanfaatkan teknik optimasi penyesuaian dan penyelarasan RLHF