Esse repositório documenta meu progresso em um curso de engenharia imediata, concentrou-se no desenvolvimento de técnicas e estratégias para trabalhar com a última geração de modelos de idiomas de grande porte de uso geral (LLMS).
Com o lançamento do ChatGPT, os LLMs tornaram -se cada vez mais populares, revolucionando a maneira como interagimos com os sistemas de IA. Antes do ChatGPT, houve vários avanços notáveis na PNL que lançaram as bases para essa revolução, incluindo o artigo "Atenção é tudo o que você precisa" de Vaswani ET. AL., Bert, GPT-2, GPT-3, T5, Roberta, Electra e Albert. Embora esses avanços sejam altamente importantes, eles podem não ser amplamente conhecidos pelo público em geral. O ano de 2023 marca um ponto de virada na adoção em massa desses modelos de uso geral em vários setores para tarefas generativas. Como cientista de dados, o aprendizado contínuo é um atributo-chave, e permanecer na vanguarda das técnicas de LLM é essencial para fornecer soluções idealmente viáveis na era do processamento de linguagem natural acionado por IA.
O objetivo principal deste curso é obter uma profunda compreensão das técnicas rápidas de engenharia para uma interação eficaz com o LLMS. Ao dominar essas estratégias, pretendo melhorar minha capacidade de desenvolver soluções inovadoras, eficazes e eficientes usando o poder da linguagem natural.
Este repositório está organizado nos capítulos seguintes: