Este repositório é um projeto feito para o Departamento de Sistemas Digitais (Universidade de Pireu) no assunto de "Governança de Sistemas de Informação", tornou os arquivos usados .jsp, .html, .css e .java. Enquanto muitas estruturas diferentes, como os bibliotecas, o hadoop mapa reduzem, o mahout e o outro.
Este projeto é nomeado "Twitter Data Analyzer" como o principal trabalho dele é coletar tweets pela mídia social "Twitter" e, em seguida, os precede, formate -os em formato AVRO, analisá -los e organizar os resultados nos HDFs do usuário. É feito de uma maneira que automatize parte do fluxo de trabalho dos analistas de dados em seu trabalho de big data.
No repositório, você encontrará:
Na documentação fornecida neste repositório, há uma extensa análise sobre como executar o projeto, para que a melhor coisa que você possa fazer é lê -lo e passar pelo progresso da instalação passo a passo explicado dentro dele.
Este projeto possui um arquivo como um relatório para um usuário e manual técnico. Você pode conseguir isso entrando em contato comigo aqui .