Este repositorio documenta mi progreso en un curso rápido de ingeniería, centrado en el desarrollo de técnicas y estrategias para trabajar con la última generación de modelos de lenguaje grande (LLM) de propósito general.
Con el lanzamiento de ChatGPT, los LLM se han vuelto cada vez más convencionales, revolucionando la forma en que interactuamos con los sistemas de IA. Antes de CHATGPT, hubo varios avances notables en PNL que han sentado las bases para esta revolución, incluida el documento "La atención es todo lo que necesita" de Vaswani ET. Al., Bert, GPT-2, GPT-3, T5, Roberta, Electra y Albert. Aunque estos avances son muy importantes, es posible que no sean ampliamente conocidos por el público en general. El año 2023 marca un punto de inflexión en la adopción masiva de estos modelos de propósito general en diversas industrias para tareas generativas. Como científico de datos, el aprendizaje continuo es un atributo clave, y permanecer en la vanguardia de las técnicas de LLM es esencial para proporcionar soluciones óptimamente viables en la era del procesamiento del lenguaje natural impulsado por la IA.
El objetivo principal de este curso es obtener una comprensión profunda de las técnicas de ingeniería rápida para una interacción efectiva con LLM. Al dominar estas estrategias, su objetivo es mejorar mi capacidad para desarrollar soluciones innovadoras, efectivas y eficientes utilizando el poder del lenguaje natural.
Este repositorio está organizado en los siguientes capítulos: