LORA turkish clip下载 - LORA turkish clip源代码下载

LORA turkish clip

Ai源码

1.0.0

下载

Lora-Turkish-Clip

这个项目是什么？

在此存储库中，我们使用Lora方法Finetune Openai的土耳其语剪辑模型。要获取有关剪辑的更多信息，您可以查看我的其他回购。

Flicker8数据集用于培训。对于土耳其字幕，使用Tasviret数据集，这是土耳其Flicker8字幕的数据集。

尽管没有必要，但笔记本电脑仍可以在Colab上运行。必须在笔记本上进行必要的库安装，以便在Colab上运行。

什么是洛拉？

低级适应性是一种芬太日模型的技术。选择并予以固定，而不是对所有层进行填充。与常规的登录而不是更改原始权重相比，初始权重和易键式权重之间的差异被存储并保存。同样将存储权重的矩阵分解为两个矩阵，这些矩阵降低了模型权重的大小，并确保初始和易1的模型相似。这意味着该模型将更具保护性，以防止Cathastorapical Messing。所有这些还减少了所有模型大小。因此，您只能节省差异（换句话说），而不是节省整个填充版本的重量。这使能够拥有一个大型基本型号和多个小洛拉重量，而不是为每个填充版本保存大型型号。

笔记本中有什么？

lora_clip_training_tasviret->用lora的剪辑代码

推理 - >演示如何加载和使用LORA模型。比较了土耳其语和英语的原始和洛拉芬特剪辑模型的表演。

如何使用模型？

我已经将模型上传到了拥抱面。该模型可以像以下示例一样使用：

 from PIL import Image
from transformers import CLIPProcessor , CLIPModel

model = CLIPModel . from_pretrained ( "openai/clip-vit-base-patch32" )
model . load_adapter ( "kesimeg/lora-turkish-clip" ) # model can be found on Huggingface ?
model . eval ()

processor = CLIPProcessor . from_pretrained ( "openai/clip-vit-base-patch32" )


img = Image . open ( "dog.png" ) # A dog image
inputs = processor ( text = [ "Çimenler içinde bir köpek." , "Bir köpek." , "Çimenler içinde bir kuş." ], images = img , return_tensors = "pt" , padding = True )
outputs = model ( ** inputs )
logits_per_image = outputs . logits_per_image
probs = logits_per_image . softmax ( dim = 1 )
print ( probs )