
Model pra-terlatih adalah model yang dibuat oleh orang lain untuk menyelesaikan masalah yang sama. Alih -alih membangun model dari awal untuk menyelesaikan masalah yang sama, kita dapat menggunakan model yang dilatih pada masalah lain sebagai titik awal. Model pra-terlatih mungkin tidak 100% akurat dalam aplikasi Anda.
Misalnya, jika Anda ingin membangun mobil belajar mandiri. Anda dapat menghabiskan waktu bertahun-tahun untuk membangun algoritma pengenalan gambar yang layak dari awal atau Anda dapat mengambil model inception (model pra-terlatih) dari Google yang dibangun di atas data Imagenet untuk mengidentifikasi gambar dalam gambar-gambar tersebut.
Anda dapat melihat visualisasi arsitektur jaringan masing -masing model dengan menggunakan Netron.

| Nama model | Keterangan | Kerangka | Lisensi |
|---|---|---|---|
| ObjectDetection | Melokalisasi dan mengidentifikasi banyak objek dalam satu gambar. | Tensorflow | Lisensi Apache |
| Topeng R-CNN | Model ini menghasilkan kotak pembatas dan topeng segmentasi untuk setiap instance objek dalam gambar. Ini didasarkan pada jaringan piramida fitur (FPN) dan tulang punggung ResNet101. | Tensorflow | Lisensi MIT (MIT) |
| Lebih cepat-rcnn | Ini adalah implementasi TensorFlow eksperimental dari RCNN yang lebih cepat - sebuah konvnet untuk deteksi objek dengan jaringan proposal wilayah. | Tensorflow | Lisensi MIT |
| Tensorflow Yolo | Ini adalah implementasi TensorFlow dari Yolo: Deteksi Objek Real-Time. | Tensorflow | Kebiasaan |
| Yolo TensorFlow ++ | Implementasi TensorFlow dari 'Yolo: Deteksi Objek Real-Time', dengan pelatihan dan dukungan aktual untuk berjalan real-time pada perangkat seluler. | Tensorflow | Lisensi Publik Umum GNU |
| Mobilenet | MobileNets menukar antara latensi, ukuran dan akurasi sambil membandingkan dengan model populer dari literatur. | Tensorflow | Lisensi MIT (MIT) |
| Deeplab | Pelabelan yang dalam untuk segmentasi gambar semantik. | Tensorflow | Lisensi Apache |
| Colornet | Jaringan saraf untuk mewarnai gambar skala abu -abu. | Tensorflow | Tidak ditemukan |
| Srgan | Foto-realistis gambar super-resolusi menggunakan jaringan permusuhan generatif. | Tensorflow | Tidak ditemukan |
| Deeposm | Train TensorFlow Neural Nets dengan fitur OpenStreetMap dan citra satelit. | Tensorflow | Lisensi MIT (MIT) |
| Jaringan Transfer Domain | Implementasi pembuatan gambar lintas domain yang tidak diawasi. | Tensorflow | Lisensi MIT |
| Tunjukkan, hadir dan beri tahu | Generator Caption Gambar Berbasis Perhatian. | Tensorflow | Lisensi MIT |
| Android-Yolo | Deteksi objek real-time pada Android menggunakan jaringan yolo, ditenagai oleh TensorFlow. | Tensorflow | Lisensi Apache |
| Resolusi Super DCSCN | Ini adalah implementasi TensorFlow dari "Resolusi Super Gambar Cepat dan Akurat oleh Deep CNN dengan Koneksi Skip dan Jaringan di Jaringan", model super-resolusi super-resolusi (SISR) berbasis pembelajaran yang mendalam. | Tensorflow | Tidak ditemukan |
| Gan-cls | Ini adalah implementasi TensorFlow eksperimental dari sintesis gambar. | Tensorflow | Tidak ditemukan |
| U-net | Untuk segmentasi tumor otak. | Tensorflow | Tidak ditemukan |
| Cyclegan yang lebih baik | Gambar tidak berpasangan ke translasi gambar. | Tensorflow | Lisensi MIT |
| Im2txt | Jaringan saraf gambar-ke-teks untuk captioning gambar. | Tensorflow | Lisensi Apache |
| LANGSING | Model klasifikasi gambar dalam TF-SLIM. | Tensorflow | Lisensi Apache |
| Delf | Fitur lokal yang dalam untuk pencocokan gambar dan pengambilan. | Tensorflow | Lisensi Apache |
| Kompresi | Gambar mengompresi dan dekompresi menggunakan jaringan Gru residual yang sudah terlatih. | Tensorflow | Lisensi Apache |
| Atensicr | Model untuk ekstraksi teks gambar dunia nyata. | Tensorflow | Lisensi Apache |
| Nama model | Keterangan | Kerangka | Lisensi |
|---|---|---|---|
| Topeng R-CNN | Model ini menghasilkan kotak pembatas dan topeng segmentasi untuk setiap instance objek dalam gambar. Ini didasarkan pada jaringan piramida fitur (FPN) dan tulang punggung ResNet101. | Keras | Lisensi MIT (MIT) |
| VGG16 | Jaringan konvolusional yang sangat dalam untuk pengenalan gambar skala besar. | Keras | Lisensi MIT (MIT) |
| VGG19 | Jaringan konvolusional yang sangat dalam untuk pengenalan gambar skala besar. | Keras | Lisensi MIT (MIT) |
| Resnet | Pembelajaran residu yang mendalam untuk pengenalan gambar. | Keras | Lisensi MIT (MIT) |
| Resnet50 | Pembelajaran residu yang mendalam untuk pengenalan gambar. | Keras | Lisensi MIT (MIT) |
| Nasnet | NASNET mengacu pada jaringan pencarian arsitektur saraf, keluarga model yang dirancang secara otomatis dengan mempelajari arsitektur model secara langsung pada dataset yang menarik. | Keras | Lisensi MIT (MIT) |
| Mobilenet | Model MobileNet V1 untuk Keras. | Keras | Lisensi MIT (MIT) |
| MobileNet v2 | Model MobileNet V2 untuk Keras. | Keras | Lisensi MIT (MIT) |
| MobileNet v3 | Model MobileNet V3 untuk Keras. | Keras | Lisensi MIT (MIT) |
| EfisienNet | Memikirkan kembali penskalaan model untuk jaringan saraf konvolusional. | Keras | Lisensi MIT (MIT) |
| Analogi gambar | Hasilkan analogi gambar menggunakan pencocokan saraf dan pencampuran. | Keras | Lisensi MIT (MIT) |
| Model Segmentasi Gambar Populer | Implementasi SEGNET, FCN, UNET dan model lain di KERAS. | Keras | Lisensi MIT |
| Segmentasi saraf ultrasonik | Tutorial ini menunjukkan cara menggunakan perpustakaan keras untuk membangun jaringan saraf yang dalam untuk segmentasi saraf gambar ultrasound. | Keras | Lisensi MIT |
| Segmentasi objek Deepmask | Ini adalah implementasi Python yang berbasis di Python dari Deepmask- jaringan saraf dalam yang kompleks untuk pembelajaran topeng segmentasi objek. | Keras | Tidak ditemukan |
| Captioning gambar monolingual dan multibahasa | Ini adalah kode sumber yang menyertai deskripsi gambar multibahasa dengan model urutan saraf. | Keras | Lisensi BSD-3-Clause |
| pix2pix | Keras Implementasi terjemahan gambar-ke-gambar dengan jaringan permusuhan bersyarat oleh Phillip Isola, Jun-yan Zhu, Tinghui Zhou, Alexei A. | Keras | Tidak ditemukan |
| Pewarnaan gambar berwarna -warni | B&W untuk mewarnai. | Keras | Tidak ditemukan |
| Cyclegan | Implementasi terjemahan gambar-ke-gambar yang tidak berpasangan menggunakan jaringan permusuhan siklus-konsisten . | Keras | Lisensi MIT |
| DUALGAN | Implementasi Dualgan: Pembelajaran ganda tanpa pengawasan untuk terjemahan gambar-ke-gambar . | Keras | Lisensi MIT |
| GAN Super-Resolution | Implementasi gambar-resolusi super gambar tunggal-realistis menggunakan jaringan permusuhan generatif . | Keras | Lisensi MIT |
| Nama model | Keterangan | Kerangka | Lisensi |
|---|---|---|---|
| detectron2 | Detectron2 adalah sistem perangkat lunak generasi berikutnya Facebook AI Research yang mengimplementasikan algoritma deteksi objek canggih | PyTorch | Lisensi Apache 2.0 |
| Fastphotostyle | Solusi bentuk tertutup untuk stylization gambar fotorealistik. | PyTorch | Atribusi Creative Commons Lisensi Publik Internasional-Sharealike 4.0 Internasional |
| Pytorch-Cyclegan dan Pix2pix | Solusi bentuk tertutup untuk stylization gambar fotorealistik. | PyTorch | Lisensi BSD |
| MASKRCNN-BENCHMark | Implementasi referensi modular yang cepat dari segmentasi instan dan algoritma deteksi objek di Pytorch. | PyTorch | Lisensi MIT |
| Prior dalam-gambar yang dalam | Pemulihan gambar dengan jaringan saraf tetapi tanpa belajar. | PyTorch | Lisensi Apache 2.0 |
| Stargan | Stargan: Jaringan permusuhan generatif terpadu untuk terjemahan gambar-ke-gambar multi-domain. | PyTorch | Lisensi MIT |
| lebih cepat-rcnn.pytorch | Proyek ini adalah implementasi R-CNN yang lebih cepat lebih cepat, yang bertujuan untuk mempercepat pelatihan model deteksi objek R-CNN yang lebih cepat. | PyTorch | Lisensi MIT |
| pix2pixhd | Sintesis dan memanipulasi gambar 2048x1024 dengan Gans bersyarat. | PyTorch | Lisensi BSD |
| Augmentor | Perpustakaan augmentasi gambar di Python untuk pembelajaran mesin. | PyTorch | Lisensi MIT |
| albumentation | Perpustakaan augmentasi gambar cepat. | PyTorch | Lisensi MIT |
| Analisis video yang dalam | Deep Video Analytics adalah platform untuk mengindeks dan mengekstraksi informasi dari video dan gambar | PyTorch | Kebiasaan |
| semantik-segmentasi-pytorch | Implementasi PyTorch untuk segmentasi semantik/adegan parsing pada dataset MIT ADE20K. | PyTorch | Lisensi BSD 3 Clause |
| Jaringan saraf yang dapat dilatih ujung ke ujung untuk pengakuan urutan berbasis gambar | Perangkat lunak ini mengimplementasikan jaringan saraf berulang konvolusional (CRNN), kombinasi dari CNN, RNN dan kerugian CTC untuk tugas pengenalan urutan berbasis gambar, seperti pengenalan teks adegan dan OCR. | PyTorch | Lisensi MIT (MIT) |
| SATUAN | Implementasi Pytorch dari algoritma Vae-Gan kami yang digabungkan untuk terjemahan gambar-ke-gambar tanpa pengawasan. | PyTorch | Atribusi Creative Commons Lisensi Publik Internasional-Nonkomersial-Sharealike 4.0 Internasional |
| Model pelabelan urutan saraf | Model pelabelan urutan cukup populer di banyak tugas NLP, seperti Named Entity Recognition (NER), Part-of-Speech (POS) Tagging dan Segmentasi Kata. | PyTorch | Lisensi Apache |
| RCNN lebih cepat | Ini adalah implementasi Pytorch dari RCNN yang lebih cepat. Proyek ini terutama didasarkan pada Py-Faster-RCNN dan TFFRCNN. Untuk detail tentang R-CNN, silakan merujuk ke makalah lebih cepat R-CNN: Menuju deteksi objek real-time dengan jaringan proposal wilayah oleh Shaoqing Ren, Kaiming He, Ross Girshick, Jian Sun. | PyTorch | Lisensi MIT |
| Segmentasi Pytorch-Semantik | Pytorch untuk segmentasi semantik. | PyTorch | Lisensi MIT |
| EDSR-PYTORCH | Versi PyTorch dari kertas 'Enhanced Deep Residual Networks untuk Single Image Super-Resolution'. | PyTorch | Lisensi MIT |
| Gambar-klasifikasi-mobile | Koleksi model klasifikasi pretrained di ImageNet-1K. | PyTorch | Lisensi MIT |
| Fadernetworks | Fader Networks: memanipulasi gambar dengan atribut geser - NIPS 2017. | PyTorch | Lisensi Publik Internasional Creative Commons Atribution-NonCommercial 4.0 International |
| NeuralTalk2-Pytorch | Model Captioning Gambar di Pytorch (Finetunable CNN di Cabang dengan_finetune). | PyTorch | Lisensi MIT |
| Randwirenn | Implementasi: "Menjelajahi jaringan saraf kabel secara acak untuk pengenalan gambar". | PyTorch | Tidak ditemukan |
| Stackgan-V2 | Implementasi PyTorch untuk mereproduksi hasil Stackgan_V2 di kertas Stackgan ++. | PyTorch | Lisensi MIT |
| Detectron Model untuk Deteksi Objek | Kode ini memungkinkan untuk menggunakan beberapa model Detectron untuk deteksi objek dari penelitian AI Facebook dengan Pytorch. | PyTorch | Lisensi Apache |
| Dextr-pytorch | Makalah ini mengeksplorasi penggunaan titik ekstrem dalam suatu objek (paling kiri, paling kanan, atas, piksel bawah) sebagai input untuk mendapatkan segmentasi objek yang tepat untuk gambar dan video. | PyTorch | Lisensi Publik Umum GNU |
| pointnet.pytorch | Implementasi PyTorch untuk "PointNet: Deep Learning On Point Sets untuk Klasifikasi dan Segmentasi 3D. | PyTorch | Lisensi MIT |
| Self-Critical.pytorch | Repositori ini mencakup pelatihan urutan kritis implementasi yang tidak resmi untuk keterlibatan gambar dan perhatian bottom-up dan top-down untuk keterangan gambar dan pertanyaan visual. | PyTorch | Lisensi MIT |
| vnet.pytorch | Implementasi Pytorch untuk V-NET: Jaringan saraf yang sepenuhnya konvolusional untuk segmentasi gambar medis volumetrik. | PyTorch | Lisensi BSD 3 Clause |
| Piwise | Segmentasi piksel-bijaksana pada dataset VOC2012 menggunakan pytorch. | PyTorch | Lisensi BSD 3 Clause |
| pspnet-pytorch | Implementasi PyTorch dari Jaringan Segmentasi PSPNET. | PyTorch | Tidak ditemukan |
| Pytorch-Srresnet | Implementasi PyTorch untuk foto super-resolusi single-gambar-realistis menggunakan jaringan permusuhan generatif. | PyTorch | Lisensi MIT (MIT) |
| Pnasnet.pytorch | Implementasi PNASNET-5 PyTorch di Imagenet. | PyTorch | Lisensi Apache |
| img_classification_pk_pytorch | Membandingkan model klasifikasi gambar Anda dengan cepat dengan model canggih. | PyTorch | Tidak ditemukan |
| Jaringan saraf yang dalam dengan mudah dibodohi | Prediksi kepercayaan diri yang tinggi untuk gambar yang tidak dapat dikenali. | PyTorch | Lisensi MIT |
| pix2pix-pytorch | Implementasi Pytorch dari "terjemahan gambar-ke-gambar menggunakan jaringan permusuhan bersyarat". | PyTorch | Tidak ditemukan |
| NVIDIA/SEMITIC-SEPECTASI | Implementasi Pytorch untuk meningkatkan segmentasi semantik melalui perambatan video dan relaksasi label, di CVPR2019. | PyTorch | Lisensi CC BY-NC-SA 4.0 |
| Penilaian saraf-gambar | Implementasi Pytorch dari penilaian gambar saraf. | PyTorch | Tidak ditemukan |
| Torchxrayvision | Model pretrained untuk prediksi patologi x-ray dada (CXR). Medis, perawatan kesehatan, radiologi | PyTorch | Lisensi Apache |
| Model Pytorch-Image | Model gambar pytorch, skrip, bobot pretrained-(SE) resnet/resnext, dpn, efisiensi, mixnet, mobileNet-v3/v2, mnasnet, nas-nas tunggal, fbnet, dan banyak lagi | PyTorch | Lisensi Apache 2.0 |
| Nama model | Keterangan | Kerangka | Lisensi |
|---|---|---|---|
| OpenPose | OpenPose mewakili sistem multi-orang real-time pertama untuk bersama-sama mendeteksi titik keypoint tubuh, tangan, dan wajah manusia (total 130 tombol keypoint) pada gambar tunggal. | Caffe | Kebiasaan |
| Jaringan konvolusional sepenuhnya untuk segmentasi semantik | Model konvolusional sepenuhnya untuk segmentasi semantik. | Caffe | Tidak ditemukan |
| Pewarnaan gambar berwarna -warni | Pewarnaan gambar berwarna -warni. | Caffe | Lisensi BSD-2 Clause |
| R-FCN | R-FCN: Deteksi objek melalui jaringan konvolusional berbasis wilayah. | Caffe | Lisensi MIT |
| CNN-VIS | Terinspirasi oleh posting blog inceptionism terbaru Google, CNN-Vis adalah alat open-source yang memungkinkan Anda menggunakan jaringan saraf konvolusional untuk menghasilkan gambar. | Caffe | Lisensi MIT (MIT) |
| Deconvnet | Belajar jaringan dekonvolusi untuk segmentasi semantik. | Caffe | Kebiasaan |
| Nama model | Keterangan | Kerangka | Lisensi |
|---|---|---|---|
| RCNN lebih cepat | Jaringan proposal wilayah memecahkan deteksi objek sebagai masalah regresi. | MXNet | Lisensi Apache, Versi 2.0 |
| SSD | SSD adalah kerangka kerja terpadu untuk deteksi objek dengan satu jaringan. | MXNet | Lisensi MIT |
| RCNN+Loss Focal Loss | Kode ini adalah versi tidak resmi untuk kehilangan fokus untuk deteksi objek yang padat. | MXNet | Tidak ditemukan |
| CNN-LSTM-CTC | Saya menyadari tiga model yang berbeda untuk pengenalan teks, dan semuanya terdiri dari lapisan kerugian CTC untuk menyadari tidak ada segmentasi untuk gambar teks. | MXNet | Tidak ditemukan |
| Faster_rcnn_for_dota | Ini adalah repo resmi Paper Dota: set data skala besar untuk deteksi objek dalam gambar udara . | MXNet | Lisensi Apache |
| Retinanet | Kehilangan fokus untuk deteksi objek yang padat. | MXNet | Tidak ditemukan |
| MobileNetv2 | Ini adalah implementasi MXNET dari arsitektur MobileNetV2 seperti yang dijelaskan dalam makalah residu terbalik dan hambatan linier: Jaringan seluler untuk klasifikasi, deteksi, dan segmentasi . | MXNet | Lisensi Apache |
| Transfer neuron-selektivitas | Kode ini adalah implementasi ulang dari eksperimen klasifikasi ImageNet dalam makalah seperti apa yang Anda sukai: penyulingan pengetahuan melalui transfer selektivitas neuron . | MXNet | Lisensi Apache |
| MobileNetv2 | Ini adalah implementasi Gluon dari arsitektur MobileNetV2 seperti yang dijelaskan dalam makalah residu terbalik dan hambatan linier: jaringan seluler untuk klasifikasi, deteksi, dan segmentasi . | MXNet | Lisensi Apache |
| Pemilihan Struktur-jarang | Kode ini adalah implementasi ulang eksperimen klasifikasi ImagEnet dalam pemilihan struktur jarang yang digerakkan oleh data untuk jaringan saraf dalam . | MXNet | Lisensi Apache |
| Fastphotostyle | Solusi bentuk tertutup untuk stylization gambar fotorealistik. | MXNet | Atribusi Creative Commons Lisensi Publik Internasional-Nonkomersial-Sharealike 4.0 Internasional |
Kontribusi Anda selalu diterima !! Harap lihat contributing.md
Lisensi MIT