Unduh FMAT - Unduh Kode Sumber FMAT

FMAT

Kode Sumber AI

1.0.0

Unduh

Fmat

Pengarang

Han-Wu-Shuang (Bruce) Bao 包寒吴霜

? [email protected]

? psychbruce.github.io

Kutipan

Bao, H.-W.-S. (2023). FMAT: Tes Asosiasi Masker Isi . https://cran.r-project.org/package=fmat
- Catatan : Ini adalah kutipan asli. Silakan merujuk ke informasi saat Anda library(FMAT) untuk format APA-7 dari versi yang Anda instal.
Bao, H.-W.-S. (2024). Tes Asosiasi Mask-Mask (FMAT): mengukur proposisi dalam bahasa alami. Jurnal Kepribadian dan Psikologi Sosial, 127 (3), 537–561. https://doi.org/10.1037/pspa0000396
Bao, H.-W.-S., & Gries, P. (2024). Stereotip ras -gender intersectional dalam bahasa alami. British Journal of Social Psychology, 63 (4), 1771–1786. https://doi.org/10.1111/bjso.12748

Instalasi

Untuk menggunakan FMAT, paket R FMAT dan tiga paket Python ( transformers , torch , huggingface-hub ) semuanya perlu diinstal.

(1) Paket R.

 # # Method 1: Install from CRAN
install.packages( " FMAT " )

# # Method 2: Install from GitHub
install.packages( " devtools " )
devtools :: install_github( " psychbruce/FMAT " , force = TRUE )

(2) Lingkungan dan paket Python

Instal Anaconda (Manajer Paket yang Disarankan yang secara otomatis menginstal Python, Python IDE seperti Spyder, dan daftar besar dependensi paket Python yang diperlukan).

Tentukan interpreter Python Anaconda di rstudio.

Rstudio → Tools → Opsi Global/Proyek
→ Python → Pilih → Lingkungan Conda
→ Pilih ".../anaconda3/python.exe"

Pasang versi spesifik paket Python "Transformers", "Torch", dan "Huggingface-Hub".
(Rstudio Terminal / Anaconda Prompt / Command Windows)

Untuk pengguna CPU:

 pip install transformers==4.40.2 torch==2.2.1 huggingface-hub==0.20.3

Untuk pengguna GPU (CUDA):

 pip install transformers==4.40.2 huggingface-hub==0.20.3
pip install torch==2.2.1 --index-url https://download.pytorch.org/whl/cu121

Lihat [Panduan untuk Akselerasi GPU] untuk panduan instalasi jika Anda memiliki perangkat GPU NVIDIA di PC Anda dan ingin menggunakan GPU untuk mempercepat pipa.
Menurut rilis Mei 2024, "Transformers" ≥ 4,41 tergantung pada "pelukan-hub" ≥ 0,23. Versi yang disarankan dari "Transformers" (4.40.2) dan "Huggingface-Hub" (0.20.3) memastikan tampilan konsol dari bilah kemajuan saat mengunduh model Bert sambil menjaga paket-paket ini sama baru mungkin.
Pengguna proxy harus menggunakan "mode global" (全局模式) untuk mengunduh model.
Jika Anda melihat kesalahan HTTPSConnectionPool(host='huggingface.co', port=443) , silakan coba (1) instal ulang Anaconda sehingga beberapa masalah yang tidak diketahui dapat diperbaiki atau (2) menurunkan Paket "URLLIB3" untuk Versi ≤ 1.25.11 ( pip install urllib3==1.25.11 ). versi) untuk terhubung ke wajah memeluk.
- https://www.cnblogs.com/devilmaycry812839668/p/17872452.html
- https://zhuanlan.zhihu.com/p/350015032

Bimbingan untuk FMAT

Langkah 1: Unduh Model Bert

Gunakan BERT_download() untuk mengunduh [Model Bert]. File model disimpan ke folder lokal Anda "%userprofile%/. Cache/huggingface". Daftar lengkap model Bert tersedia di Hugging Face.

Gunakan BERT_info() dan BERT_vocab() untuk menemukan informasi terperinci dari model Bert.

Langkah 2: Desain kueri FMAT

Desain kueri yang secara konseptual mewakili konstruksi yang akan Anda ukur (lihat Bao, 2024, JPSP untuk cara merancang kueri).

Gunakan FMAT_query() dan/atau FMAT_query_bind() untuk menyiapkan data.table .

Langkah 3: Jalankan FMAT

Gunakan FMAT_run() untuk mendapatkan data mentah (estimasi probabilitas) untuk analisis lebih lanjut.

Beberapa langkah preprocessing telah dimasukkan dalam fungsi untuk lebih mudah digunakan (lihat FMAT_run() untuk detailnya).

Untuk varian Bert menggunakan <mask> daripada [MASK] sebagai token mask, kueri input akan dimodifikasi secara otomatis sehingga pengguna selalu dapat menggunakan [MASK] dalam desain kueri.
Untuk beberapa varian Bert, karakter awalan khusus seperti u0120 dan u2581 akan ditambahkan secara otomatis agar sesuai dengan seluruh kata (bukan subwords) untuk [MASK] .

Catatan

Perbaikan sedang berlangsung, terutama untuk adaptasi ke model BerT yang lebih beragam (kurang populer).
Jika Anda menemukan bug atau memiliki masalah menggunakan fungsi, silakan laporkan pada masalah github atau kirimkan saya email.

Panduan untuk percepatan GPU

Secara default, paket FMAT menggunakan CPU untuk mengaktifkan fungsionalitas untuk semua pengguna. Tetapi untuk pengguna tingkat lanjut yang ingin mempercepat pipa dengan GPU, fungsi FMAT_run() sekarang mendukung menggunakan perangkat GPU, sekitar 3x lebih cepat dari CPU.

Hasil tes (pada komputer pengembang, tergantung pada ukuran model Bert):

CPU (Intel 13th-Gen I7-1355U): 500 ~ 1000 kueri/menit
GPU (NVIDIA GEFORCE RTX 2050): 1500 ~ 3000 kueri/menit

Daftar Periksa:

Pastikan Anda memiliki perangkat GPU NVIDIA (misalnya, seri GeForce RTX) dan driver GPU NVIDIA yang diinstal pada sistem Anda.
Instal Pytorch (paket Python torch ) dengan dukungan CUDA.
- Temukan panduan untuk perintah instalasi di https://pytorch.org/get-started/locally/.
- CUDA hanya tersedia di Windows dan Linux, tetapi tidak pada macOS.
- Jika Anda telah menginstal versi torch tanpa dukungan CUDA, silakan hapus instalan terlebih dahulu (Command: pip uninstall torch ) dan kemudian instal yang disarankan.
- Anda juga dapat menginstal versi CUDA Toolkit yang sesuai (misalnya, untuk versi torch yang mendukung CUDA 12.1, versi CUDA Toolkit 12.1 yang sama juga dapat diinstal).

Contoh kode untuk menginstal pytorch dengan dukungan CUDA:
(Rstudio Terminal / Anaconda Prompt / Command Windows)

 pip install torch==2.2.1 --index-url https://download.pytorch.org/whl/cu121

Model Bert

Keandalan dan validitas dari 12 model BERT yang representatif telah ditetapkan dalam artikel penelitian saya, tetapi pekerjaan di masa depan diperlukan untuk memeriksa kinerja model lain.

(Model nama pada pemelukan wajah - Ukuran file model yang diunduh)

Bert-Base-Incased (420 MB)
Bert-Base-Cased (416 MB)
Bert-Large-Incased (1283 MB)
Bert-Large (1277 MB)
Distilbert-Base-Incased (256 MB)
Distilbert-Base-Cased (251 MB)
Albert-Base-V1 (45 MB)
Albert-Base-V2 (45 MB)
Roberta-Base (476 MB)
Distilroberta-base (316 MB)
VINAI/BERTWEET-BASE (517 MB)
Vinai/Bertweet-Large (1356 MB)

Jika Anda baru mengenal Bert, referensi ini dapat membantu:

Apa itu Fill-Mask? [Huggingface]
Bert yang dapat dieksplorasi [Huggingface]
Dokumentasi Model Bert [HuggingFace]
Bert menjelaskan
Memecah Bert
Berlustrasi Bert
Panduan Visual untuk Bert

library( FMAT )
models = c(
  " bert-base-uncased " ,
  " bert-base-cased " ,
  " bert-large-uncased " ,
  " bert-large-cased " ,
  " distilbert-base-uncased " ,
  " distilbert-base-cased " ,
  " albert-base-v1 " ,
  " albert-base-v2 " ,
  " roberta-base " ,
  " distilroberta-base " ,
  " vinai/bertweet-base " ,
  " vinai/bertweet-large "
)
BERT_download( models )

 ℹ Device Info:

R Packages:
FMAT          2024.5
reticulate    1.36.1

Python Packages:
transformers  4.40.2
torch         2.2.1+cu121

NVIDIA GPU CUDA Support:
CUDA Enabled: TRUE
CUDA Version: 12.1
GPU (Device): NVIDIA GeForce RTX 2050


── Downloading model "bert-base-uncased" ──────────────────────────────────────────
→ (1) Downloading configuration...
config.json: 100%|██████████| 570/570 [00:00<00:00, 114kB/s]
→ (2) Downloading tokenizer...
tokenizer_config.json: 100%|██████████| 48.0/48.0 [00:00<00:00, 23.9kB/s]
vocab.txt: 100%|██████████| 232k/232k [00:00<00:00, 1.50MB/s]
tokenizer.json: 100%|██████████| 466k/466k [00:00<00:00, 1.98MB/s]
→ (3) Downloading model...
model.safetensors: 100%|██████████| 440M/440M [00:36<00:00, 12.1MB/s] 
✔ Successfully downloaded model "bert-base-uncased"

── Downloading model "bert-base-cased" ────────────────────────────────────────────
→ (1) Downloading configuration...
config.json: 100%|██████████| 570/570 [00:00<00:00, 63.3kB/s]
→ (2) Downloading tokenizer...
tokenizer_config.json: 100%|██████████| 49.0/49.0 [00:00<00:00, 8.66kB/s]
vocab.txt: 100%|██████████| 213k/213k [00:00<00:00, 1.39MB/s]
tokenizer.json: 100%|██████████| 436k/436k [00:00<00:00, 10.1MB/s]
→ (3) Downloading model...
model.safetensors: 100%|██████████| 436M/436M [00:37<00:00, 11.6MB/s] 
✔ Successfully downloaded model "bert-base-cased"

── Downloading model "bert-large-uncased" ─────────────────────────────────────────
→ (1) Downloading configuration...
config.json: 100%|██████████| 571/571 [00:00<00:00, 268kB/s]
→ (2) Downloading tokenizer...
tokenizer_config.json: 100%|██████████| 48.0/48.0 [00:00<00:00, 12.0kB/s]
vocab.txt: 100%|██████████| 232k/232k [00:00<00:00, 1.50MB/s]
tokenizer.json: 100%|██████████| 466k/466k [00:00<00:00, 1.99MB/s]
→ (3) Downloading model...
model.safetensors: 100%|██████████| 1.34G/1.34G [01:36<00:00, 14.0MB/s]
✔ Successfully downloaded model "bert-large-uncased"

── Downloading model "bert-large-cased" ───────────────────────────────────────────
→ (1) Downloading configuration...
config.json: 100%|██████████| 762/762 [00:00<00:00, 125kB/s]
→ (2) Downloading tokenizer...
tokenizer_config.json: 100%|██████████| 49.0/49.0 [00:00<00:00, 12.3kB/s]
vocab.txt: 100%|██████████| 213k/213k [00:00<00:00, 1.41MB/s]
tokenizer.json: 100%|██████████| 436k/436k [00:00<00:00, 5.39MB/s]
→ (3) Downloading model...
model.safetensors: 100%|██████████| 1.34G/1.34G [01:35<00:00, 14.0MB/s]
✔ Successfully downloaded model "bert-large-cased"

── Downloading model "distilbert-base-uncased" ────────────────────────────────────
→ (1) Downloading configuration...
config.json: 100%|██████████| 483/483 [00:00<00:00, 161kB/s]
→ (2) Downloading tokenizer...
tokenizer_config.json: 100%|██████████| 48.0/48.0 [00:00<00:00, 9.46kB/s]
vocab.txt: 100%|██████████| 232k/232k [00:00<00:00, 16.5MB/s]
tokenizer.json: 100%|██████████| 466k/466k [00:00<00:00, 14.8MB/s]
→ (3) Downloading model...
model.safetensors: 100%|██████████| 268M/268M [00:19<00:00, 13.5MB/s] 
✔ Successfully downloaded model "distilbert-base-uncased"

── Downloading model "distilbert-base-cased" ──────────────────────────────────────
→ (1) Downloading configuration...
config.json: 100%|██████████| 465/465 [00:00<00:00, 233kB/s]
→ (2) Downloading tokenizer...
tokenizer_config.json: 100%|██████████| 49.0/49.0 [00:00<00:00, 9.80kB/s]
vocab.txt: 100%|██████████| 213k/213k [00:00<00:00, 1.39MB/s]
tokenizer.json: 100%|██████████| 436k/436k [00:00<00:00, 8.70MB/s]
→ (3) Downloading model...
model.safetensors: 100%|██████████| 263M/263M [00:24<00:00, 10.9MB/s] 
✔ Successfully downloaded model "distilbert-base-cased"

── Downloading model "albert-base-v1" ─────────────────────────────────────────────
→ (1) Downloading configuration...
config.json: 100%|██████████| 684/684 [00:00<00:00, 137kB/s]
→ (2) Downloading tokenizer...
tokenizer_config.json: 100%|██████████| 25.0/25.0 [00:00<00:00, 3.57kB/s]
spiece.model: 100%|██████████| 760k/760k [00:00<00:00, 4.93MB/s]
tokenizer.json: 100%|██████████| 1.31M/1.31M [00:00<00:00, 13.4MB/s]
→ (3) Downloading model...
model.safetensors: 100%|██████████| 47.4M/47.4M [00:03<00:00, 13.4MB/s]
✔ Successfully downloaded model "albert-base-v1"

── Downloading model "albert-base-v2" ─────────────────────────────────────────────
→ (1) Downloading configuration...
config.json: 100%|██████████| 684/684 [00:00<00:00, 137kB/s]
→ (2) Downloading tokenizer...
tokenizer_config.json: 100%|██████████| 25.0/25.0 [00:00<00:00, 4.17kB/s]
spiece.model: 100%|██████████| 760k/760k [00:00<00:00, 5.10MB/s]
tokenizer.json: 100%|██████████| 1.31M/1.31M [00:00<00:00, 6.93MB/s]
→ (3) Downloading model...
model.safetensors: 100%|██████████| 47.4M/47.4M [00:03<00:00, 13.8MB/s]
✔ Successfully downloaded model "albert-base-v2"

── Downloading model "roberta-base" ───────────────────────────────────────────────
→ (1) Downloading configuration...
config.json: 100%|██████████| 481/481 [00:00<00:00, 80.3kB/s]
→ (2) Downloading tokenizer...
tokenizer_config.json: 100%|██████████| 25.0/25.0 [00:00<00:00, 6.25kB/s]
vocab.json: 100%|██████████| 899k/899k [00:00<00:00, 2.72MB/s]
merges.txt: 100%|██████████| 456k/456k [00:00<00:00, 8.22MB/s]
tokenizer.json: 100%|██████████| 1.36M/1.36M [00:00<00:00, 8.56MB/s]
→ (3) Downloading model...
model.safetensors: 100%|██████████| 499M/499M [00:38<00:00, 12.9MB/s] 
✔ Successfully downloaded model "roberta-base"

── Downloading model "distilroberta-base" ─────────────────────────────────────────
→ (1) Downloading configuration...
config.json: 100%|██████████| 480/480 [00:00<00:00, 96.4kB/s]
→ (2) Downloading tokenizer...
tokenizer_config.json: 100%|██████████| 25.0/25.0 [00:00<00:00, 12.0kB/s]
vocab.json: 100%|██████████| 899k/899k [00:00<00:00, 6.59MB/s]
merges.txt: 100%|██████████| 456k/456k [00:00<00:00, 9.46MB/s]
tokenizer.json: 100%|██████████| 1.36M/1.36M [00:00<00:00, 11.5MB/s]
→ (3) Downloading model...
model.safetensors: 100%|██████████| 331M/331M [00:25<00:00, 13.0MB/s] 
✔ Successfully downloaded model "distilroberta-base"

── Downloading model "vinai/bertweet-base" ────────────────────────────────────────
→ (1) Downloading configuration...
config.json: 100%|██████████| 558/558 [00:00<00:00, 187kB/s]
→ (2) Downloading tokenizer...
vocab.txt: 100%|██████████| 843k/843k [00:00<00:00, 7.44MB/s]
bpe.codes: 100%|██████████| 1.08M/1.08M [00:00<00:00, 7.01MB/s]
tokenizer.json: 100%|██████████| 2.91M/2.91M [00:00<00:00, 9.10MB/s]
→ (3) Downloading model...
pytorch_model.bin: 100%|██████████| 543M/543M [00:48<00:00, 11.1MB/s] 
✔ Successfully downloaded model "vinai/bertweet-base"

── Downloading model "vinai/bertweet-large" ───────────────────────────────────────
→ (1) Downloading configuration...
config.json: 100%|██████████| 614/614 [00:00<00:00, 120kB/s]
→ (2) Downloading tokenizer...
vocab.json: 100%|██████████| 899k/899k [00:00<00:00, 5.90MB/s]
merges.txt: 100%|██████████| 456k/456k [00:00<00:00, 7.30MB/s]
tokenizer.json: 100%|██████████| 1.36M/1.36M [00:00<00:00, 8.31MB/s]
→ (3) Downloading model...
pytorch_model.bin: 100%|██████████| 1.42G/1.42G [02:29<00:00, 9.53MB/s]
✔ Successfully downloaded model "vinai/bertweet-large"

── Downloaded models: ──

                           size
albert-base-v1            45 MB
albert-base-v2            45 MB
bert-base-cased          416 MB
bert-base-uncased        420 MB
bert-large-cased        1277 MB
bert-large-uncased      1283 MB
distilbert-base-cased    251 MB
distilbert-base-uncased  256 MB
distilroberta-base       316 MB
roberta-base             476 MB
vinai/bertweet-base      517 MB
vinai/bertweet-large    1356 MB

✔ Downloaded models saved at C:/Users/Bruce/.cache/huggingface/hub (6.52 GB)

BERT_info( models )

                      model   size vocab  dims   mask
                     <fctr> <char> <int> <int> <char>
 1:       bert-base-uncased  420MB 30522   768 [MASK]
 2:         bert-base-cased  416MB 28996   768 [MASK]
 3:      bert-large-uncased 1283MB 30522  1024 [MASK]
 4:        bert-large-cased 1277MB 28996  1024 [MASK]
 5: distilbert-base-uncased  256MB 30522   768 [MASK]
 6:   distilbert-base-cased  251MB 28996   768 [MASK]
 7:          albert-base-v1   45MB 30000   128 [MASK]
 8:          albert-base-v2   45MB 30000   128 [MASK]
 9:            roberta-base  476MB 50265   768 <mask>
10:      distilroberta-base  316MB 50265   768 <mask>
11:     vinai/bertweet-base  517MB 64001   768 <mask>
12:    vinai/bertweet-large 1356MB 50265  1024 <mask>

(Diuji 2024-05-16 di komputer pengembang: HP Probook 450 G10 Notebook PC)

Paket terkait

Sementara FMAT adalah metode inovatif untuk analisis cerdas komputasi psikologi dan masyarakat, Anda juga dapat mencari kotak alat integratif untuk metode analitik teks lainnya. Paket R lain yang saya kembangkan --- PsychwordVec --- berguna dan ramah pengguna untuk analisis penyematan kata (misalnya, tes asosiasi embedding, weat). Silakan merujuk ke dokumentasinya dan jangan ragu untuk menggunakannya.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-11
ukuran 66.54KB
Berasal dari Github

Aplikasi Terkait

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua