Los modelos de lenguaje y las incrustaciones de palabras utilizadas hoy en día hicieron uso de grandes cantidades de datos de sesgo no etiquetados para su fase de entrenamiento respectiva , que aumentó por el mecanismo de atención de los nuevos transformadores como una nueva técnica de aprendizaje no supervisada.
Con todas estas muestras de entrenamiento, seguramente habrá muestras sesgadas que afectan los resultados de los sistemas resultantes.
A veces tenemos que tomar decisiones sesgadas con nuestros sistemas, pero también es bueno conocer el sesgo dentro de nuestro modelo.
BiaSexploration4J permite la exploración de incrustaciones de palabras y la medición de la tendencia del modelo de lenguaje basado en Bert, este último basado en el trabajo (Nangia et al., 2020), para explorar diferentes sesgos dentro del sistema dado.
Esta herramienta está compuesta por diferentes clases que tienen como objetivo evaluar algún aspecto del sesgo para que pueda instalarla en cualquier lugar que desee.
# Clone the repository
git clone https://github.com/LMartinezEXEX/BiasExploration4J.git
# Change CWD inside the cloned repository
cd BiasExploration4J
# For use as a dependency from other projects
mvn clean installConsulte nuestras páginas wiki donde encontrará información, notas y consejos sobre cómo usar BiaSexploration4J , definiciones de conceptos centrales y ciertas limitaciones a tener en cuenta al explorar el sesgo en sus datos, así como ejemplos para ayudarlo a internalizarlo mejor.
Este proyecto está bajo una licencia MIT.