Experimente o ML usando instruções de vetor de hélio. Ele depende do CMSIS-DSP, mas alguns kernels adicionais podem ser fornecidos por esta biblioteca quando não estão disponíveis no CMSIS-DSP.
Não é uma nova estrutura ML. São apenas alguns exemplos para demonstrar que, para redes simples, o CMSIS-DSP pode ser suficiente (mas requer mais trabalho).
Esta biblioteca está apenas focando pequenas redes com o objetivo de exigir que o mínimo de dependências execute um modelo.
Se você precisar de grãos totalmente quantizados e/ou uso de uma NPU ARM para Cortex-M, use o TensorFlow Lite para micro e cmSis-nn.
O modelo deve ser escrito em C (chamando os kernels necessários). Nenhuma conversão automática do TensorFlow ou Pytorch é fornecida.
Um script é fornecido para facilitar a exportação dos pesos do python e usá -los do C.
A licença é Apache, exceto por alguns exemplos que foram adaptados de outros repositórios do GitHub e podem usar outras licenças (como o MIT).
Aqui está um vídeo do Tinyllama a 50 MHz no Cortex-M55: