
Kami telah mengganti nama repositiry dari xlearning ke hbox.
Jika Anda memiliki klon lokal repositori, harap perbarui URL jarak jauh Anda:
git remote set-url origin https://github.com/Qihoo360/hbox.gitHbox adalah platform penjadwalan yang nyaman dan efisien yang dikombinasikan dengan data besar dan kecerdasan buatan, dukungan untuk berbagai pembelajaran mesin, kerangka kerja pembelajaran yang mendalam. Hbox berjalan di atas benang Hadoop dan telah mengintegrasikan kerangka kerja pembelajaran yang mendalam seperti Tensornet, Tensorflow, MXNet, Caffe, Theano, Pytorch, Keras, XGBoost, Horovod, Openmpi, Tensor2Tensor. Mendukung Jadwal Sumber Daya GPU, dijalankan di Docker dan Restful API Management Interface. Hbox memiliki skalabilitas dan kompatibilitas yang memuaskan.
中文文档

Ada tiga komponen penting dalam hbox:
Selain mode terdistribusi kerangka TensorFlow dan MXNet, Hbox mendukung mode mandiri dari semua kerangka kerja pembelajaran yang mendalam seperti Caffe, Theano, Pytorch. Selain itu, Hbox memungkinkan versi khusus dan multi-versi kerangka kerja secara fleksibel.
Data Pelatihan dan Hasil Model Simpan ke HDFS (Dukungan S3). Hbox mengaktifkan untuk menentukan strategi input untuk data input --input dengan mengatur parameter --input-strategy atau konfigurasi hbox.input.strategy . Hbox mendukung tiga cara untuk membaca data input HDFS:
Mirip dengan strategi baca, Hbox memungkinkan untuk menentukan strategi output untuk data output --output dengan mengatur parameter --output-strategy atau konfigurasi hbox.output.strategy . Ada dua jenis mode output hasil:
Detail lebih lanjut lihat manajemen data
Antarmuka aplikasi dapat dibagi menjadi empat bagian:

Kecuali konstruksi otomatis clusterspec pada mode TensorFlow Mode Terdistribusi, program di Mode Standalone TensorFlow dan kerangka kerja pembelajaran mendalam lainnya dapat dieksekusi di Hbox secara langsung.
Jalankan perintah berikut di direktori root kode sumber:
./mvnw package
Setelah menyusun, paket distribusi bernama hbox-1.1-dist.tar.gz akan dihasilkan di bawah core/target di direktori root. Membongkar paket distribusi, subdirektori berikut akan dihasilkan di bawah direktori root:
Untuk mengatur konfigurasi, pengguna perlu mengatur HBOX_CONF_DIR ke folder yang berisi hbox-site.xml yang valid, atau menautkan folder ini ke $HBOX_HOME/conf .
Di bawah direktori "conf" dari paket distribusi pembongkaran "$ hbox_home", konfigurasikan file terkait:
hbox-env.sh: atur variabel lingkungan, seperti:
hbox-site.xml: Konfigurasikan properti terkait. Perhatikan bahwa properti yang terkait dengan layanan riwayat harus konsisten dengan apa yang telah dikonfigurasi ketika layanan riwayat dimulai. Untuk lebih jelasnya, silakan lihat bagian konfigurasi 。
LOG4J.PROPERTIES ostingSonfigure Level Log
$HBOX_HOME/sbin/start-history-server.sh . Gunakan $HBOX_HOME/bin/hbox-submit untuk mengirimkan aplikasi ke cluster di klien hbox. Berikut adalah contoh kirim untuk aplikasi TensorFlow.
Unggah direktori "data" di bawah akar paket distribusi pembongkaran ke HDFS
cd $HBOX_HOME
hadoop fs -put data /tmp/
cd $HBOX_HOME/examples/tensorflow
$HBOX_HOME/bin/hbox-submit
--app-type "tensorflow"
--app-name "tf-demo"
--input /tmp/data/tensorflow#data
--output /tmp/tensorflow_model#model
--files demo.py,dataDeal.py
--worker-memory 10G
--worker-num 2
--worker-cores 3
--ps-memory 1G
--ps-num 1
--ps-cores 2
--queue default
python demo.py --data_path=./data --save_path=./model --log_dir=./eventLog --training_epochs=10
Arti parameternya adalah sebagai berikut:
| Nama Properti | Arti |
|---|---|
| nama aplikasi | Nama Aplikasi sebagai "TF-Demo" |
| tipe aplikasi | Jenis Aplikasi sebagai "TensorFlow" |
| masukan | File input, jalur HDFS adalah "/TMP/Data/TensorFlow" terkait dengan Dir lokal "./data" |
| keluaran | File output, jalur HDFS adalah "/tmp/tensorflow_model" terkait dengan dir ". |
| file | program aplikasi dan file lokal yang diperlukan, termasuk demo.py, datadeal.py |
| Pekerja memori | Jumlah memori yang akan digunakan untuk proses pekerja adalah 10GB |
| pekerja-num | Jumlah wadah pekerja untuk digunakan untuk aplikasi adalah 2 |
| Pekerja-Cores | Jumlah inti yang akan digunakan untuk proses pekerja adalah 3 |
| PS memori | Jumlah memori yang akan digunakan untuk proses PS adalah 1GB |
| ps-num | Jumlah wadah PS yang akan digunakan untuk aplikasi adalah 1 |
| PS-CORES | Jumlah inti yang akan digunakan untuk proses PS adalah 2 |
| antre | antrian yang diajukan aplikasi |
Untuk detail lebih lanjut, atur bagian parameter kirim 。
Hbox FAQ
Hbox dirancang, ditulis, ditinjau dan diuji oleh tim di GitHub:
@Yuance li, @wen ouuyang, @runying jia, @yuhan jia, @lei wang
