SkyCode ist ein mehrsprachiges Open -Source -Programmiermodell, das von Singularity Intelligence veröffentlicht wurde. Unterstützt Java, JavaScript, C, C ++, Python, Go, Shell und andere Mainstream -Programmiersprachen und kann chinesische Anmerkungen verstehen. Das Modell kann den Code ausfüllen, Probleme und andere Vorgänge lösen, sodass Sie sich von der Programmierung befreien und sich auf die Lösung größerer Probleme konzentrieren können.


Technischer Vorteil 1: Abdeckung mehrerer Programmiersprachen
Verschiedene Programmiersprachen konzentrieren sich auf die Lösung von Problemen in verschiedenen Plattformen und Umgebungen, und unterschiedliche Programmiersprachen haben ihre eigenen Gründe für ihre Existenz. Der Code, den Singularity Intelligence SkyCode erzeugen kann, enthält nicht nur eine breite Palette von JavaScript, Python, Java, C usw., sondern deckt auch mehr als zehn Programmiersprachen wie PHP, GO, Swift usw. ab und ermöglicht es den Benutzern, dass Benutzer unterschiedliche Sprachen die leistungsstarken Codes -Generierungskapazitäten von Skycode erleben können.
Technischer Vorteil 2: Optimieren Sie chinesische Anmerkungen
Auf dem Gebiet der großen Modelle vor dem Training wurde es immer von der englischen Community dominiert, und das auf GPT3 basierende Codegenerierungsmodell hat das gleiche Problem. Mit der Erfahrung, chinesische Modelle zutiefst zu kultivieren, optimierte und innovierte Singularität Zhiyuan die Verwendung einzigartiger chinesischer Codierungsmethoden auf der Grundlage der Merkmale von Chinesen, was eher mit chinesischen Sprachgewohnheiten übereinstimmt, was das Verständnis des Modells für chinesische Annotationen besser macht.
Technischer Vorteil 3: Exzellente Fähigkeit zur Problemlösung
Auf dem Humaneval-Datensatz, der die Fähigkeit zur Problemlösung von Codegenerierungsmodellen widerspiegelt, ist Singularity Intelligent Source SkyCode's Problemlösungsfähigkeit ebenfalls weitaus höher als die anderer Open-Source-Modelle.
| Modell | Pass@1 | Pass@10 | Pass@100 |
|---|---|---|---|
| GPT-NEO 1.3B | 4,79% | 7,47% | 16,30% |
| GPT-NEO 2.7B | 6,41% | 11,27% | 21,37% |
| GPT-J 6b | 11,62% | 15,74% | 27,74% |
| Sky_code (2.6b) | 12,84% | 21,07% | 35,97% |
Es ist ersichtlich, dass SkyCode mit einer Parametermenge von 2,6B nicht nur viel höher ist als GPT-NEO 1,3B mit weniger Parametern, sondern auch viel höher als das GPT-Neo 2,7B-Modell mit einer vergleichbaren Parametermenge. Selbst im Vergleich zum GPT-J 6B-Modell mit höheren Parametern weist SkyCode eine stärkere Fähigkeit zur Problemlösung auf. Im Pass@100-Indikator, der die obere Grenze der Fähigkeit zur Problemlösung besser widerspiegelt, beträgt der Nettowert von Skycode, der GPT-J überschreitet, 8,23%.
————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————–
推荐
transformers>=4.18.0
# -*- coding: utf-8 -*-
from transformers import GPT2LMHeadModel
from transformers import AutoTokenizer
from transformers import TextGenerationPipeline
model = GPT2LMHeadModel . from_pretrained ( "SkyWork/SkyCode" )
tokenizer = AutoTokenizer . from_pretrained ( "SkyWork/SkyCode" , trust_remote_code = True )
text_generator = TextGenerationPipeline ( model , tokenizer , device = 0 )
input_str = "if __name__"
max_new_tokens = 40
print ( text_generator ( input_str , max_new_tokens = max_new_tokens , do_sample = True ))https://huggingface.co/skywork/skycode
MIT -Lizenz

