(Trabalhe em andamento!)
O processamento de linguagem natural (PNL) fez avanços substanciais nos últimos anos devido ao sucesso das técnicas modernas baseadas em aprendizado profundo. Com o surgimento da popularidade da PNL e a disponibilidade de diferentes formas de dados em larga escala, agora é ainda mais imperativo entender o funcionamento interno das técnicas e conceitos de PNL, desde os primeiros princípios, à medida que encontram seu caminho para o uso e as aplicações do mundo real que afetam a sociedade em geral. Construir intuições e ter uma sólida compreensão dos conceitos são importantes para criar técnicas inovadoras, melhorar a pesquisa e construir tecnologias de IA e PNL centradas em seres humanos.
Introduzimos uma nova série chamada Fundamentos da PNL, onde pretendemos ensinar sobre importantes técnicas e conceitos de PNL a partir dos primeiros princípios. Introduziremos o aspecto teórico e a motivação de cada conceito abordado ao longo da série. Em seguida, obteremos experiência prática usando métodos de bootstrap, ferramentas padrão do setor e outras bibliotecas de código aberto para implementar as diferentes técnicas. Ao longo do caminho, também abordaremos as melhores práticas, compartilharemos referências importantes, apontaremos erros comuns a serem evitados ao treinar e construir modelos de PNL e discutir o que está por vir.
Junte -se à nossa comunidade Slack para encontrar mais sobre este e outros projetos em andamento. Sinta -se à vontade para me alcançar no Twitter para um convite para o nosso grupo de folga.
Capítulo 1: Segmentação de Tokenização, Lemmatização, Stemming e Sentença - Notebook Colab, versão da Web
nlp_fundamentals . Os problemas com a good first issue são boas tarefas para começar.