Repositorio oficial del documento "¿Qué tan cerca está el chatgpt para los expertos humanos? Corpus de comparación, evaluación y detección".
¡Vea también → (?

Sí, proponemos el primer corpus de comparación humano vs. CHATGPT , llamado HC3 .
Proponemos el primer corpus de contraste humano vs. CHATGPT llamado HC3 .

¿La primera versión de los conjuntos de datos HC3 ahora está disponible?
En la comunidad china, el conjunto de datos HC3 también está disponible en Modelscope:
Divisiones de trenes/prueba y versiones filtradas del documento, Ref a Google Drive Enlace en HC3/ReadMe.MD.
Si los conjuntos de datos de origen utilizados en este corpus tienen una licencia específica que es más estricta que CC-by-SA, nuestros productos siguen lo mismo.
| División inglesa | Fuente | Licencia de origen | Nota |
|---|---|---|---|
| reddit_eli5 | ELI5 | Licencia BSD | |
| Open_qa | Wikiqa | PWC Custom | |
| wiki_csai | Wikipedia | CC-by-SA | |
| medicamento | Diálogo médico | Desconocido | Preguntando |
| finanzas | Fiqa | Desconocido | Preguntando por? |
| División china | Fuente | Licencia de origen | Nota |
|---|---|---|---|
| Open_qa | WebTextqa y Baikeqa | Licencia de MIT | |
| baike | Baidu Baike | Ninguno | |
| nlpcc_dbqa | Nlpcc-dbqa | Desconocido | Preguntando |
| medicamento | Diálogo médico chino | CC-BY-NC 4.0 | |
| finanzas | Finemezhidao | CC-By 4.0 | |
| psicología | En Baidu AI Studio | CC0 | |
| ley | Legalqa | Desconocido | Preguntando |
(Alojado en? Spaces de cara abrazando)
Proporcionamos tres tipos de detectores, todos en bilingüe / proporcionamos tres tipos de detectores, todos en inglés:
En la plataforma de la comunidad china Modelscope, las tres versiones de los detectores también están disponibles:
Los pesos de los modelos están disponibles?
| Puntos de control de modelos | Comentario |
|---|---|
| chatgpt detector-roBerta | Para detectar un solo texto |
| chatgpt-qa detector-roBerta | Para detectar un par de preguntas y respuestas |
| chatgpt detector-roberta-chines | Detectar texto único, versión china |
| chatgpt-qa detector-roberta-chinese | Detectar un par de texto de control de calidad, versión china |
Los modelos ingleses se basan en Roberta-Base.
| Eventos | Fechas |
|---|---|
| Lanzamiento del proyecto / lanzamiento del proyecto | 2022-12-09 ✅ |
| Recopilación de datos de comparación / recopilación de datos de comparación | 2022-12-11 a ahora? ️ |
| Release ChatGpt Detector (Demo) / Detector Demo Release | 2023-01-11 ✅ |
| Modelos de lanzamiento / modelo de código abierto | 2023-01-18 ✅ |
| Comparación Corpus Release / Corpus Open Source | 2023-01-18 ✅ |
| Documento de investigación / lanzamiento de trabajo de investigación | 2023-01-19 ✅ |
| ... | ... |
Vea este documento ARXIV: 2301.07597
@article{guo-etal-2023-hc3,
title = "How Close is ChatGPT to Human Experts? Comparison Corpus, Evaluation, and Detection",
author = "Guo, Biyang and
Zhang, Xin and
Wang, Ziyuan and
Jiang, Minqi and
Nie, Jinran and
Ding, Yuxuan and
Yue, Jianwei and
Wu, Yupeng",
journal={arXiv preprint arxiv:2301.07597}
year = "2023",
}
El 9 de diciembre de 2022, que es 10 días después del lanzamiento de CHATGPT, comenzamos este proyecto, para dos propósitos:
El 9 de diciembre de 2022, el décimo día del lanzamiento de ChatGPT, comenzamos este proyecto para dos propósitos:
¡ Bienvenido a seguir nuestro proyecto!
Bienvenido a seguir nuestro proyecto . ¡Esperamos recibir comentarios del público en general para ayudarnos a mejorar nuestro modelo y contribuir a abrir la investigación académica juntos!
Somos un grupo de investigadores insignificantes (a la sombra de ChatGPT) que esperan hacer un trabajo significativo para la comunidad.
Somos un pequeño grupo de investigadores (a la sombra de ChatGPT) pero queremos hacer algo significativo para la comunidad. El equipo de este proyecto consta de estudiantes de doctorado e ingenieros de 6 universidades/empresas.
| Biyang Guo | Minqi Jiang | Ziyuan Wang | Xin Zhang |
| Jinran nie | Yuxuan ding | Jianwei Yue | Yupeng Wu |