Download do MAX Image Resolution Enhancer - MAX Image Resolution Enhancer Download do Código Fonte

MAX Image Resolution Enhancer

Outro código-fonte

v1.1.0

Baixar

IBM Developer Model Asset Exchange: Image Resolution Enhancer

Este repositório contém código para instanciar e implantar um intensificador de resolução de imagem. Este modelo é capaz de aumentar uma imagem pixelizada por um fator de 4, enquanto gera detalhes foto-realistas.

O GAN é baseado neste repositório do GitHub e neste artigo de pesquisa.

O modelo foi treinado em 600.000 imagens do conjunto de dados do OpenImages V4 e os arquivos do modelo são hospedados no armazenamento de objetos em nuvem IBM. O código deste repositório implanta o modelo como um serviço da Web em um contêiner do Docker. Esse repositório foi desenvolvido como parte da troca de ativos do IBM Developer Model e a API pública é alimentada pela IBM Cloud.

Modelo Metadados

Domínio	Aplicativo	Indústria	Estrutura	Dados de treinamento	Formato de dados de entrada
Visão	Super-resolução	Em geral	Tensorflow	OpenImages v4	Imagem (RGB/HWC)

Benchmark

Set5	Srgan do autor	Este srgan
Psnr	29.40	29.56
Ssim	0,85	0,85

Set14	Srgan do autor	Este srgan
Psnr	26.02	26.25
Ssim	0,74	0,72

BSD100	Srgan do autor	Este srgan
Psnr	25.16	24.4
Ssim	0,67	0,67

O desempenho desta implementação foi avaliado em três conjuntos de dados: SET5, SET14 e BSD100. As métricas PSNR (Pico de sinal / ruído) e SSIM (índice de similaridade estrutural) foram avaliadas, embora o artigo discute o MOS (pontuação média de opinião) como a métrica mais favorável. Em essência, a implementação do SRGAN negocia uma melhor pontuação PSNR ou SSIM, para um resultado mais atraente para o olho humano. Isso leva a uma coleção de imagens de saída com detalhes mais nítidos e realistas.

NOTA: O srgan no papel foi treinado em amostras de imagenet de 350k, enquanto este srgan foi treinado em fotos de 600k OpenImages V4.

Referências

C. Ledig, L. Theis, F. Huszar, J. Caballero, A. Cunningham, A. Acosta, A. Aitken, A. Tejani, J. Totz, Z. Wang, W. Shi , Super-resolução de imagem única foto-realista usando uma rede adversária gerativa, Arxiv, 2017.
Srgan-TensorFlow (fonte do código do modelo)
tensorflow-srgan
Artefatos de deconvolução e tabuleiro de xadrez

Licenças

Componente	Licença	Link
Este repositório	Apache 2.0	LICENÇA
Pesos do modelo	Apache 2.0	LICENÇA
Código do modelo (3ª festa)	Mit	LICENÇA
Amostras de teste	CC por 2.0	Readme de ativos
	CC0	Readme de ativos

Pré-requisitos:

docker : a interface da linha de comando do docker. Siga as instruções de instalação para o seu sistema.
Os recursos mínimos recomendados para este modelo são de memória de 8 GB (consulte a solução de problemas) e 4 CPUs.
Se você estiver no X86-64/AMD64, sua CPU deve apoiar o AVX no mínimo.

Opções de implantação

Implantar do Quay
Implante no Red Hat OpenShift
Implante em Kubernetes
Execute localmente

Implantar do Quay

Para executar a imagem do Docker, que inicia automaticamente a API de servir o modelo, execute:

 $ docker run -it -p 5000:5000 quay.io/codait/max-image-resolution-enhancer

Isso extrairá uma imagem pré-criada do registro do recipiente do Quay.io (ou usará uma imagem existente se já em cache localmente) e executá-la. Se você preferir verificar e criar o modelo localmente, poderá seguir as etapas de execução localmente abaixo.

Implante no Red Hat OpenShift

Você pode implantar o microsserviço que serve modelo no Red Hat OpenShift, seguindo as instruções para o OpenShift Web Console ou quay.io/codait/max-image-resolution-enhancer plataforma de contêineres OpenShift CLI neste tutorial, especificando o nome da imagem.

Implante em Kubernetes

Você também pode implantar o modelo no Kubernetes usando a imagem mais recente do Docker no Quay.

Em seu cluster Kubernetes, execute os seguintes comandos:

 $ kubectl apply -f https://github.com/IBM/max-image-resolution-enhancer/raw/master/max-image-resolution-enhancer.yaml

O modelo estará disponível internamente na porta 5000 , mas também pode ser acessado externamente através do NodePort .

Um tutorial mais elaborado sobre como implantar esse modelo máximo para produção no IBM Cloud pode ser encontrado aqui.

Execute localmente

Construa o modelo
Implantar o modelo
Use o modelo
Desenvolvimento
Limpar

1. Construa o modelo

Clone este repositório localmente. Em um terminal, execute o seguinte comando:

 $ git clone https://github.com/IBM/max-image-resolution-enhancer.git

Altere o diretório para a pasta base do repositório:

 $ cd max-image-resolution-enhancer

Para construir a imagem do Docker localmente, execute:

 $ docker build -t max-image-resolution-enhancer .

Todos os ativos de modelo necessários serão baixados durante o processo de construção. Observe que atualmente essa imagem do Docker é apenas a CPU (adicionaremos suporte para imagens de GPU posteriormente).

2. Implante o modelo

Para executar a imagem do Docker, que inicia automaticamente a API de servir o modelo, execute:

 $ docker run -it -p 5000:5000 max-image-resolution-enhancer

3. Use o modelo

O servidor da API gera automaticamente uma página de documentação de arrogância interativa. Vá para http://localhost:5000 para carregá -lo. A partir daí, você pode explorar a API e também criar solicitações de teste.

Use o model/predict o terminal para carregar uma imagem de teste (você pode usar uma das imagens de teste da pasta samples/test_examples/low_resolution ) para obter uma imagem de saída de alta resolução retornada.

A imagem de entrada ideal é um arquivo PNG com uma resolução entre 100x100 e 500x500, de preferência sem qualquer processamento pós-captura e cores chamativas. O modelo é capaz de gerar detalhes a partir de uma imagem pixelizada (DPI baixa), mas não pode corrigir uma imagem 'borrada'.

entrada Esquerda: imagem de entrada (128 × 80). Direita: Imagem de saída (512 × 320)

Captura de tela da interface do usuário Swagger

Você também pode testá -lo na linha de comando, por exemplo:

 $ curl -F "image=@samples/test_examples/low_resolution/food.png" -XPOST http://localhost:5000/model/predict > food_high_res.png

food_high_res.png comando acima enviará o arquivo de baixa resolução food.png .

4. Desenvolvimento

Para executar o aplicativo API do Flask no modo de depuração, edite config.py para definir DEBUG = True nas configurações do aplicativo. Você precisará reconstruir a imagem do Docker (consulte a Etapa 1).

Lembre -se de definir DEBUG = False ao executar o modelo em produção.

5. Limpeza

Para parar o recipiente do docker, digite CTRL + C no seu terminal.

Solução de problemas

Chamar o model/predict final mata o recipiente do docker com a mensagem Killed

Isso provavelmente é causado devido à limitação padrão da alocação de memória do Docker a 2 GB. Navegue até o menu Preferences no aplicativo Docker Desktop. Use o controle deslizante para aumentar a memória disponível para 8 GB e reiniciar o Docker Desktop.

Os detalhes na imagem de saída são diferentes do que pode ser esperado e às vezes não são fisicamente possíveis

Este modelo gera detalhes basicamente 'do ar'. Criar algo do nada não é possível sem fazer suposições. A rede tenta reconhecer elementos na imagem de baixa resolução da qual pode inferir como a realidade (olho humano | super-resolução) poderia ter parecido. Se um grupo de pixels se assemelha fortemente a uma observação que não está relacionada ao conteúdo da imagem, isso pode levar a observar resultados que não são "fisicamente possíveis".

Por exemplo: Um pixel branco em uma imagem de baixa resolução pode ter sido convertido em um floco de neve, embora a imagem original possa ter sido tirada no deserto. Este exemplo é imaginário e não foi realmente observado.

Artefatos na imagem de saída

Infelizmente, observar artefatos em algumas imagens é inevitável, pois qualquer rede neural está sujeita a limitações técnicas e características dos dados de treinamento.

Lembre -se de que os melhores resultados são alcançados com o seguinte:
Uma imagem PNG
Uma imagem que é suficientemente ampliada. Durante o processo, a rede agrupa um bloco de pixels. Se o bloco contiver mais detalhes do que a rede produzir, o resultado será espúrio.
Uma imagem tirada sob luz natural, sem filtros e com poucas cores brilhantes ou chamativas. A rede neural não foi treinada em imagens fortemente editadas.
Uma imagem que tem uma resolução suficientemente alta para não confundir a rede com várias possibilidades (por exemplo, um pixel único em uma imagem de baixa resolução pode representar um carro inteiro, pessoa, sanduíche, ..)
O modelo é capaz de gerar detalhes a partir de uma imagem pixelizada (DPI baixa), mas não pode corrigir uma imagem 'borrada'.

Recursos e contribuições

Se você estiver interessado em contribuir para o projeto Model Asset Exchange ou tiver alguma dúvida, siga as instruções aqui.

Expandir

Informações adicionais

Versão v1.1.0
Tipo Outro código-fonte
Data da Última Atualização 2025-02-27
tamanho 17.84MB
Vindo de Github

Aplicativos Relacionados

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0

Informações Relacionadas Todos

MAX Image Resolution Enhancer

IBM Developer Model Asset Exchange: Image Resolution Enhancer

Modelo Metadados

Benchmark

Referências

Licenças

Pré-requisitos:

Opções de implantação

Implantar do Quay

Implante no Red Hat OpenShift

Implante em Kubernetes

Execute localmente

1. Construa o modelo

2. Implante o modelo

3. Use o modelo

4. Desenvolvimento

5. Limpeza

Solução de problemas

Recursos e contribuições

Bulk Image Downloader

pytorch image models

Aprimorador de fotos com IA

galeria de imagens moa

Host de imagem CF

Host de imagem CF

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf