#Detecte o idioma de cordas muito curtas [Langbot]
[! [Build Status] [Build-Badge]] [Build-Status] [! [Status da cobertura] [Cobertura-Badge]] [Status de cobertura]
(*) Com base no conjunto de dados extraído do TedTalks
Os dados de texto extraídos das negociações TED em 56 idiomas foram convertidos em sua representação binária de 4 bytes para cada letra, a codificação UTF-8. Usando o TensorFlow, treinei uma rede neural profunda para classificar a linguagem com base em pequenas entradas. Consegui uma precisão de 91% com 17 idiomas falados e 80% de precisão com todos os 56 idiomas.
O modelo é conversível para o Tflite, para que você possa executar a detecção de linguagem offline em dispositivos móveis.
[Voltar ao topo]
Você pode relatar os bugs no rastreador de edição
OU
Você pode me enviar uma mensagem se não conseguir fazê -lo funcionar. Na verdade, você deve me enviar uma mensagem de qualquer maneira.
[Voltar ao topo]
Este programa foi desenvolvido para proteger um banco de dados SQLite com dados multilíngues. Essas cifras básicas foram selecionadas para fornecer criptografia fraca sem impactar o desempenho. Pode haver outras cifras que possam fornecer criptografia mais forte sem desempenho degradante. Se você conhece um, não tenha vergonha de fazer uma solicitação de tração :)
Para fazer contribuição:
git clone https://github.com/wahabjawed/language-detection-mobile.git
cd language-detection-mobile
Use Intellij Idea para abrir o projeto
[Voltar ao topo]
Copyright 2020 Abdul Wahab
Licenciado sob a licença do MIT (a "licença"); Você não pode usar esse arquivo, exceto em conformidade com a licença. Você pode obter uma cópia da licença em
https://opensource.org/licenses/MIT
A menos que exigido pela lei aplicável ou acordada por escrito, o software distribuído sob a licença é distribuído "como está", sem garantias ou condições de qualquer tipo, expressa ou implícita. Consulte a licença para o idioma específico que rege as permissões e limitações sob a licença.
[Voltar ao topo]