Descargar gemma_pytorch - Descargar el código fuente de gemma

gemma_pytorch

Pitón

1.0.0

Descargar

Gemma en Pytorch

Gemma es una familia de modelos abiertos livianos y de última generación construidos a partir de la investigación y la tecnología utilizadas para crear modelos Google Gemini. Son modelos de idiomas grandes solo de texto a texto, disponibles en inglés, con pesas abiertas, variantes previamente capacitadas y variantes ajustadas a instrucciones. Para obtener más detalles, consulte los siguientes enlaces:

Gemma en Google AI
Gemma en Kaggle
Gemma en Vertex AI Model Garden

Esta es la implementación oficial de Pytorch de los modelos Gemma. Proporcionamos implementaciones de modelo e inferencia utilizando Pytorch y Pytorch/XLA, y admitimos la ejecución de inferencia en CPU, GPU y TPU.

Actualizaciones

[26 de junio] Apoyo a Gemma V2. Puedes encontrar los puntos de control en Kaggle y abrazar la cara
[9 de abril] Soporte Codegemma. Puedes encontrar los puntos de control en Kaggle y abrazar la cara
[5 de abril] Apoya a Gemma V1.1. Puede encontrar los puntos de control V1.1 en Kaggle y abrazando la cara.

Descargar Gemma Model Checkpoint

Puede encontrar los puntos de control del modelo en Kaggle aquí.

Alternativamente, puede encontrar los puntos de control del modelo en el centro de abrazadera aquí. Para descargar los modelos, realice el repositorio del modelo del modelo de interés y haga clic en la pestaña Files and versions , y descargue el modelo y los archivos de tokenizer. Para la descarga programática, si tiene instalado huggingface_hub , también puede ejecutar:

 huggingface-cli download google/gemma-7b-it-pytorch

Tenga en cuenta que puede elegir entre variantes 2b, 2b V2, 7b, 7b int8 cuantificadas, 9B y 27B.

 VARIANT=<2b or 7b or 9b or 27b>
CKPT_PATH=<Insert ckpt path here>

Pruébalo gratis en Colab

Siga los pasos en https://ai.google.dev/gemma/docs/pytorch_gemma.

Pruébalo con Pytorch

Prerrequisito: asegúrese de tener el permiso de configuración Docker correctamente como un usuario no raíz.

sudo usermod -aG docker $USER
newgrp docker

Construye la imagen Docker.

DOCKER_URI=gemma: ${USER}

docker build -f docker/Dockerfile ./ -t ${DOCKER_URI}

Ejecute la inferencia de Gemma en la CPU.

PROMPT= " The meaning of life is "

docker run -t --rm 
    -v ${CKPT_PATH} :/tmp/ckpt 
    ${DOCKER_URI} 
    python scripts/run.py 
    --ckpt=/tmp/ckpt 
    --variant= " ${VARIANT} " 
    --prompt= " ${PROMPT} "
    # add `--quant` for the int8 quantized model.

Ejecute la inferencia de Gemma en GPU.

PROMPT= " The meaning of life is "

docker run -t --rm 
    --gpus all 
    -v ${CKPT_PATH} :/tmp/ckpt 
    ${DOCKER_URI} 
    python scripts/run.py 
    --device=cuda 
    --ckpt=/tmp/ckpt 
    --variant= " ${VARIANT} " 
    --prompt= " ${PROMPT} "
    # add `--quant` for the int8 quantized model.

Pruébelo con Pytorch/XLA

Construya la imagen Docker (CPU, TPU).

DOCKER_URI=gemma_xla: ${USER}

docker build -f docker/xla.Dockerfile ./ -t ${DOCKER_URI}

Construya la imagen Docker (GPU).

DOCKER_URI=gemma_xla_gpu: ${USER}

docker build -f docker/xla_gpu.Dockerfile ./ -t ${DOCKER_URI}

Ejecute la inferencia de Gemma en la CPU.

docker run -t --rm 
    --shm-size 4gb 
    -e PJRT_DEVICE=CPU 
    -v ${CKPT_PATH} :/tmp/ckpt 
    ${DOCKER_URI} 
    python scripts/run_xla.py 
    --ckpt=/tmp/ckpt 
    --variant= " ${VARIANT} " 
    # add `--quant` for the int8 quantized model.

Ejecute la inferencia de Gemma en TPU.

Nota: Asegúrese de usar el contenedor Docker construido desde xla.Dockerfile .

docker run -t --rm 
    --shm-size 4gb 
    -e PJRT_DEVICE=TPU 
    -v ${CKPT_PATH} :/tmp/ckpt 
    ${DOCKER_URI} 
    python scripts/run_xla.py 
    --ckpt=/tmp/ckpt 
    --variant= " ${VARIANT} " 
    # add `--quant` for the int8 quantized model.

Ejecute la inferencia de Gemma en GPU.

Nota: Asegúrese de usar el contenedor Docker construido desde xla_gpu.Dockerfile .

docker run -t --rm --privileged 
    --shm-size=16g --net=host --gpus all 
    -e USE_CUDA=1 
    -e PJRT_DEVICE=CUDA 
    -v ${CKPT_PATH} :/tmp/ckpt 
    ${DOCKER_URI} 
    python scripts/run_xla.py 
    --ckpt=/tmp/ckpt 
    --variant= " ${VARIANT} " 
    # add `--quant` for the int8 quantized model.

Notas de tokenizador

99 Los tokens no utilizados están reservados en el modelo de tokenizador previo a la aparición para ayudar con capacitación/ajuste más eficiente. Los tokens no utilizados están en el formato de cadena de <unused[0-98]> con el rango de ID de token de [7-105] .

 "<unused0>": 7,
"<unused1>": 8,
"<unused2>": 9,
...
"<unused98>": 105,

Descargo de responsabilidad

Este no es un producto de Google compatible oficialmente.

Expandir

Información adicional

Versión 1.0.0
Tipo Pitón
Fecha de actualización 2025-07-13
tamaño 2.01MB
Proviene de Github

Aplicaciones relacionadas

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
pytorch image models

2024-11-03
nextcloud_share_url_downloader

2024-11-01
Motor de análisis de datos Lihua versión gratuita 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ToDo Co

Pitón

1.0.0
Python Portfolio

Pitón
Herramienta de gráficos de datos de código abierto Redash v24.10.0

Pitón

24.10.0
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo