what llm to use what llm to use

what llm to use

Anderer Quellcode

1.0.0

Herunterladen

Was für ein LLM? Eine Perspektive aus dem Devai -Raum

Da sich die Dinge im Devai -Raum schnell bewegt, eine Kurzform für die Gemeinschaft von Entwicklern, die mit Hilfe von Großsprachmodellen (LLMs) Software aufbauen, kann es schwierig sein, herauszufinden, welches Modell verwendet werden soll.

Wir haben dieses Repository auf der Grundlage unserer Erfahrungen als Teil der Weiter -Community gestartet. Fühlen Sie sich frei, Verbesserungen vorzuschlagen und uns zu helfen, es auf dem Laufenden zu halten, indem Sie eine Pull-Anfrage öffnen!

Welche LLMs gibt es?

Es gibt viele LLMs. Wir haben uns entschlossen, uns auf die zu konzentrieren, die wir jetzt Leute sehen, die wir jetzt verwenden:

LLMS -Grafik

Sie finden einen CSV, der hier alle diese Modelle und Informationen dazu enthält.

Welche LLMs werden beim Codieren verwendet?

Wie entscheiden sich die Leute?

Die erste Wahl, die Sie normalerweise treffen, ist, ob Sie eine Open-Source- oder ein kommerzielles Modell verwenden möchten:

Normalerweise wählen Sie ein Open-Source -LLM aus, wenn Sie Ihren Code in Ihrer Umgebung aufbewahren möchten, über genügend verfügbare Speicher verfügen, Ihre Kosten niedrig halten möchten oder alles verwalten und optimieren möchten.
Normalerweise wählen Sie ein kommerzielles LLM aus, wenn Sie das beste Modell wünschen, bevorzugen ein einfaches und zuverlässiges Setup, verfügen nicht über viel verfügbare Speicher. Machen Sie sich nichts aus, wenn Ihr Code Ihre Umgebung verlässt oder nicht von Kostenproblemen abgeschreckt wird.

Wenn Sie sich für eine Open-Source -LLM entscheiden, ist Ihre nächste Entscheidung, ob das Modell auf Ihrem lokalen Computer oder auf einem gehosteten Modellanbieter eingerichtet werden soll:

Normalerweise verwenden Sie eine Open-Source-LLM auf Ihrem lokalen Maschine , wenn Sie über genügend Speicher verfügen, kostenlose Nutzung wünschen oder das Modell verwenden möchten, ohne eine Internetverbindung zu benötigen.
Normalerweise verwenden Sie eine Open-Source-LLM für einen gehosteten Anbieter , wenn Sie das beste Open-Source-Modell möchten, auf Ihrer lokalen Maschine nicht viel Speicher auf Ihrem lokalen Computer haben oder das Modell mehrerer Personen bedienen soll.

Wir behalten eine Anleitung zum Bereitstellen eines Open-Source-Code-LLM für Ihr Team hier.

Wenn Sie sich für eine kommerzielle LLM entscheiden, erhalten Sie normalerweise API -Schlüssel und spielen mit mehreren davon zum Vergleich. Sowohl die Qualität der Vorschläge als auch die Kosten für die Verwendung können wichtige Kriterien sein.

Open Source

Dies ist eine Liste der Open-Source -LLMs, die Entwickler beim Codieren verwenden, das bis Oktober 2023 von den meisten beliebtesten bis am wenigsten beliebt ist.

1. Code Lama

Code Lama ist ein LLM, das von Meta zum Generieren und Diskussion von Code geschult wurde. Es basiert auf Lama 2. Obwohl es unter dem WizardCoder und dem Phind-Codellama auf der Big Code-Models-Rangliste liegt, ist es das Basismodell für beide. Es gibt auch eine Vielzahl von Größen: 7b, 13b und 34b, was es sowohl für lokale Maschinen als auch bei gehosteten Anbietern beliebt macht. Zu diesem Zeitpunkt ist es das bekannteste Open-Source-Basismodell für die Codierung und führt die Open-Source-Anstrengung, um codierende LLMs zu erstellen.

Details

 Creator: Meta
Date released: August 24th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 34B

2. WizardCoder

WizardCoder ist ein LLM, das vom WizardLM -Team auf Code Lama aufgebaut ist. Die EVOL-Instruct-Methode wird für die Codierung von Aufgaben angepasst, um einen Trainingsdatensatz zu erstellen, der zum Feinabstimmen von Code-Lama verwendet wird. Es ist in den gleichen Größen wie Code Lama: 7b, 13b und 34b. Infolgedessen ist es die beliebteste Open-Source-Unterrichts-LLM bisher.

Details

 Creator: WizardLM
Date released: August 26th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 7B, 13B, 34B

3. Phind-Codellama

Phind-Codellama ist ein LLM, das von Phind auf Code Lama aufgebaut ist. Ein proprietärer Datensatz von ~ 80.000 hochwertigen Programmierproblemen und -lösungen wurde verwendet, um Code-Lama-Code-Lama zu optimieren. Dieses feinstimmige Modell wurde dann auf 1,5B zusätzliche Token weiter abgestimmt. Derzeit führt es in die Rangliste der großen Code -Modelle. Es ist jedoch nur als 34B -Parametermodell erhältlich, sodass mehr verfügbare Speicher verwendet werden müssen.

Details

 Creator: Phind
Date released: August 28th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 34B

4. Mistral

Mistral ist ein 7B -Parameter LLM, der von Mistal AI trainiert wird. Es ist das zuletzt veröffentlichte Modell auf dieser Liste, nachdem es Ende September gesunken ist. Mistal AI sagt, dass sie „die Codellama 7B -Leistung in Code nähert und gleichzeitig in englischen Aufgaben gut bleibt“. Obwohl die Leute in den ersten Wochen nach der Veröffentlichung nur in einer kleinen Größe erhältlich sind. Die ersten fein abgestimmten LLMs, die sie als Basis nutzen, beginnen nun zu tauchen, und wir werden wahrscheinlich mehr in Zukunft sehen.

Details

 Creator: Mistral AI
Date released: September 27th, 2023
License: Apache 2.0
Base model: Mistral
Parameters: 7B

5. StarCoder

StarCoder ist ein 15B -Parameter LLM, der von BigCode trainiert wurde und seiner Zeit, als es im Mai freigesetzt wurde, voraus war. Es wurde auf über 80 Programmiersprachen aus dem Stapel (V1.2) mit ausgeschlossenen Opt-out-Anforderungen trainiert. Es ist kein Anweisungsmodell und Befehle wie "Schreiben Sie eine Funktion, die die Quadratwurzel berechnet" funktioniert nicht gut. Durch die Verwendung der Tech -Assistent -Eingabeaufforderung können Sie dies jedoch hilfreicher machen.

Details

 Creator: BigCode
Date released: May 4th, 2023
License: OpenRAIL-M
Base model: StarCoder
Parameters: 15B

6. Deepseek Codierer

Deepseek Codierer ist ein LLM, der von Deepseek AI auf 2 Billionen Token trainiert wurde. Mit einem Datensatz, der sich aus mehr als 80 Programmiersprachen zusammensetzt, ist es das neueste Modell auf dieser Liste und es wurde berichtet, dass es bei verschiedenen Coding-Benchmarks ziemlich hoch ist.

Details

 Creator: DeepSeek AI
Date released: November 3rd, 2023
License: DeepSeek License Agreement
Base model: DeepSeek Coder
Parameters: 1.3B, 6.7B, 33B

7. Lama2

Lama 2 ist ein LLM, das von Meta auf 2 Billionen Token trainiert wurde. Es ist die beliebteste Open -Source -LLM insgesamt, daher verwenden einige Entwickler es, obwohl es nicht so gut ist wie viele der oben genannten Modelle, um Code -Änderungen zu erstellen. Es ist auch wichtig, weil Code Lama, der beliebteste LLM für die Codierung, darauf aufbaut, was wiederum die Grundlage für WizardCoder und Phind-Codellama ist.

Details

 Creator: Meta
Date released: July 18th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 70B

Kommerziell

Dies ist eine Liste der kommerziellen LLMs, die Entwickler beim Codieren verwenden, das bis zum Oktober 2023 von den meisten am beliebtesten bis am wenigsten beliebt ist.

1. GPT-4

GPT-4 von OpenAI gilt allgemein als die beste LLM, die beim Codieren verwendet werden kann. Es ist sehr hilfreich, wenn Sie Code generieren und diskutieren. Sie müssen jedoch Ihren Code über die API an die Öffnung schicken und kann ziemlich teuer sein. Trotzdem ist es die beliebteste LLM für die Codierung insgesamt und die Mehrheit der Entwickler verwendet es an diesem Punkt, während sie kodieren. Alle OpenAI-API-Benutzer, die vor dem 6. Juli 2023 eine erfolgreiche Zahlung von 1 USD oder mehr geleistet haben, erhielten Zugang zu GPT-4 und planen, bald den Zugang für alle Entwickler zu eröffnen.

2. GPT-4 Turbo

GPT-4 Turbo von OpenAI ist billiger und schneller als GPT-4. Es verfügt über einen Wissens Cutoff von April 2023 und ein 128.000 Kontextfenster. Derzeit ist es im November 2023 in der Vorschau, aber jeder mit einem OpenAI-API-Konto und vorhandenen GPT-4-Zugriff kann es verwenden.

3. GPT-3.5 Turbo

GPT-3,5 Turbo von Openai ist billiger und schneller als GPT-4; Seine Vorschläge sind jedoch bei weitem nicht so hilfreich. Sie müssen auch Ihren Code über die API an die Öffnung senden. Es ist die zweitbeliebteste LLM für die Codierung insgesamt bisher. Alle Entwickler können es jetzt verwenden, nachdem sie sich für ein OpenAI -Konto angemeldet haben.

4. Claude 2

Claude 2 ist ein LLM, das von Anthropic trainiert wurde und die Codierungsfähigkeiten im Vergleich zur ersten Version von Claude erheblich verbessert hat. Es ist insbesondere im Vergleich zu anderen LLMs hervorgerufen, wenn Sie einen großen Kontext bereitstellen. Sie müssen Ihren Code über die API an anthropisch senden. Sie müssen sich an dieser Stelle bewerben, um Zugang zu Claude 2 zu erhalten.

5. Palm 2

Palm 2 ist ein von Google trainierter LLM. Um es auszuprobieren, müssen Sie Ihren Code über die Palm -API an Google senden, nachdem Sie einen API -Schlüssel über Makersuite erhalten haben, die sich derzeit in der öffentlichen Vorschau befinden.

Beitragen

Wenn Sie ein Modell fehlen oder eine Meinung teilen möchten, begrüßen wir Sie, um eine PR oder ein Problem zu eröffnen! Wir hoffen, einen Community-betriebenen und aktuellen Index der hilfreichsten Sprachmodelle für die Codierung aufrechtzuerhalten.

Wenn Ihnen dieser Blog -Beitrag gefallen hat und mehr über Devai lesen möchten - die Community von Leuten, die mit Hilfe von LLMs Software aufbauen -, treten Sie in der Zukunft in unserem monatlichen Newsletter bei.

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-02-25
Größe 1.59MB
Kommt von Github

Ähnliche Anwendungen

TensorRT LLM

2024-11-10
WAS FÜR DAS AUTOSPIEL

2023-05-28
Also welche App

2023-05-23
Was zum Golf?

2022-08-26
Was für ein Labyrinth

2022-08-02
Was zum Dub!

2022-08-02

what llm to use

Was für ein LLM? Eine Perspektive aus dem Devai -Raum

Welche LLMs gibt es?

Welche LLMs werden beim Codieren verwendet?

Wie entscheiden sich die Leute?

Open Source

1. Code Lama

2. WizardCoder

3. Phind-Codellama

4. Mistral

5. StarCoder

6. Deepseek Codierer

7. Lama2

Kommerziell

1. GPT-4

2. GPT-4 Turbo

3. GPT-3.5 Turbo

4. Claude 2

5. Palm 2

Beitragen

TensorRT LLM

WAS FÜR DAS AUTOSPIEL

Also welche App

Was zum Golf?

Was für ein Labyrinth

Was zum Dub!

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf