Repositori Resmi Kertas "Seberapa dekat chatgpt dengan para ahli manusia? Perbandingan korpus, evaluasi, dan deteksi".
Lihat juga → (? Ruang umpan balik untuk detektor, silakan tinggalkan umpan balik Anda di sini! Silakan tinggalkan komentar berharga Anda!)

Ya, kami mengusulkan Corpus Perbandingan Manusia vs Chatgpt pertama, bernama HC3 .
Kami mengusulkan korpus kontras manusia vs chatgpt pertama yang disebut HC3 .

Versi pertama dari dataset HC3 sekarang tersedia?
Di komunitas Cina, dataset HC3 juga tersedia di Modelscope:
Perpecahan kereta/tes & versi yang difilter dari makalah ini, tautan ref ke Google Drive di HC3/ReadMe.md.
Jika dataset sumber yang digunakan dalam korpus ini memiliki lisensi khusus yang lebih ketat dari CC-by-SA, produk kami mengikuti hal yang sama.
| Bahasa Inggris Split | Sumber | Lisensi Sumber | Catatan |
|---|---|---|---|
| reddit_eli5 | Eli5 | Lisensi BSD | |
| open_qa | Wikiqa | PWC Custom | |
| wiki_csai | Wikipedia | Cc-by-sa | |
| obat | Dialog Medis | Tidak dikenal | Meminta |
| keuangan | Fiqa | Tidak dikenal | Bertanya oleh? |
| Split Cina | Sumber | Lisensi Sumber | Catatan |
|---|---|---|---|
| open_qa | WebTextQA & Baikeqa | Lisensi MIT | |
| Baike | Baidu Baike | Tidak ada | |
| NLPCC_DBQA | NLPCC-DBQA | Tidak dikenal | Meminta |
| obat | Dialog Medis Cina | CC-BY-NC 4.0 | |
| keuangan | Financezhidao | CC-BY 4.0 | |
| psikologi | Di studio baidu ai | CC0 | |
| hukum | Legalqa | Tidak dikenal | Meminta |
(Di -host di ruang wajah memeluk)
Kami menyediakan tiga jenis detektor, semuanya dalam bahasa bilingual / kami menyediakan tiga jenis detektor, semuanya dalam bahasa Inggris:
Di platform komunitas Modelscope Chinese, ketiga versi detektor juga tersedia:
Bobot model semua tersedia di model peluknya:
| Pos Pemeriksaan Model | Komentar |
|---|---|
| chatgpt-detector-roberta | Untuk mendeteksi satu bagian teks |
| Chatgpt-QA-Detector-Roberta | Untuk mendeteksi pasangan tanya jawab |
| Chatgpt-Detector-Roberta-Chinese | Mendeteksi teks tunggal, versi Cina |
| CHATGPT-QA-DETECTOR-ROBERTA-CHINESE | Mendeteksi sepasang teks QA, versi Cina |
Model-model Inggris didasarkan pada basis Roberta.
| Acara | Tanggal |
|---|---|
| Peluncuran Proyek / Peluncuran Proyek | 2022-12-09 ✅ |
| Pengumpulan Data / Koleksi Data Perbandingan Perbandingan | 2022-12-11 hingga sekarang? ️ |
| Rilis rilis detektor chatgpt (demo) / demo detektor | 2023-01-11 ✅ |
| Model Rilis / Model Open Source | 2023-01-18 ✅ |
| Perbandingan Corpus Release / Corpus Open Source | 2023-01-18 ✅ |
| Rilis Makalah Penelitian / Penelitian | 2023-01-19 ✅ |
| ... | ... |
Lihat makalah ini Arxiv: 2301.07597
@article{guo-etal-2023-hc3,
title = "How Close is ChatGPT to Human Experts? Comparison Corpus, Evaluation, and Detection",
author = "Guo, Biyang and
Zhang, Xin and
Wang, Ziyuan and
Jiang, Minqi and
Nie, Jinran and
Ding, Yuxuan and
Yue, Jianwei and
Wu, Yupeng",
journal={arXiv preprint arxiv:2301.07597}
year = "2023",
}
Pada 9 Desember 2022, yang 10 hari setelah peluncuran chatgpt, kami memulai proyek ini, untuk dua tujuan:
Pada 9 Desember 2022, hari ke -10 peluncuran chatgpt, kami memulai proyek ini untuk dua tujuan:
Selamat datang untuk mengikuti proyek kami !
Selamat datang untuk mengikuti proyek kami. Kami berharap dapat menerima umpan balik dari masyarakat umum untuk membantu kami meningkatkan model kami dan berkontribusi untuk membuka penelitian akademik bersama!
Kami adalah sekelompok peneliti yang tidak penting (dalam bayangan chatgpt) berharap untuk melakukan beberapa pekerjaan yang signifikan untuk masyarakat.
Kami adalah sekelompok kecil peneliti (dalam bayang -bayang chatgpt) tetapi ingin melakukan sesuatu yang bermakna bagi masyarakat. Tim proyek ini terdiri dari mahasiswa dan insinyur doktor dari 6 universitas/perusahaan.
| Biyang Guo | Minqi Jiang | Ziyuan Wang | Xin Zhang |
| Jinran Nie | Yuxuan Ding | Jianwei Yue | Yupeng Wu |