Elon Musks künstliches Intelligenzunternehmen XAI hat an diesem Montag sein neuestes Sprachmodell GROK3 veröffentlicht, eine Veröffentlichung mit einem bedeutenden Fortschritt, das das Unternehmen auf dem Gebiet der künstlichen Intelligenz erzielt hat. Auf der Pressekonferenz enthüllte Musk, dass das neue Modell dank des mit etwa 200.000 GPU ausgestatteten Rechenzentrums auf Memphis das zehnfache Rechenleistung seines Vorgängers hat, das das Modell mit einer starken Rechenleistung unterstützt.
Die Modelle der GROK3 -Serie haben eine Vielzahl von Varianten auf den Markt gebracht, darunter eine optimierte Version, die einen Teil der Genauigkeit opfert und gleichzeitig die Geschwindigkeit erhöht. Darüber hinaus wurde das neu gestartete „Inferenz“ -Modell speziell zur Lösung mathematischer und wissenschaftlicher Probleme entwickelt, und Benutzer können diese Funktionen durch die Einstellungen „Think“ und „Gehirn“ in der GROK -Schnittstelle anpassen. Xai sagte, diese Version sei noch nicht fertiggestellt worden, das Modell wird immer noch kontinuierlich geschult, und das Team plant, in den kommenden Wochen weitere Verbesserungen und Optimierungen vorzunehmen.
Laut der AI -Benchmarking -Plattform LMARena.ai erzielte GROK3 im Chatbot -Feld mehr als 1.400 Punkte und wurde ein führender Anbieter auf diesem Gebiet. Es ist in allen Kategorien wie Programmierung, Überstieg von OpenAI-, Anthropic- und Google -Modellen übertroffen. Die tatsächliche Leistung kann sich jedoch von den Benchmark -Ergebnissen unterscheiden. Obwohl Claude3.5SonNet beispielsweise niedriger ist als einige Modelle in der Codierung von Benchmarks, halten es viele Benutzer immer noch für eine bessere Wahl für Programmieraufgaben.
Der OpenAI -Gründer Andrej Karpathy erhielt einen frühen Zugang zu GROK3 und lobte die logische Argumentationsfähigkeit des Modells stark. Karpasi sagte, die "Think" -Funktion kann erfolgreich komplexe Aufgaben wie die Berechnung von GPT-2-Trainingsflops oder das Erstellen von hexagonalem Netz für Brettspiele erledigen, die zuvor nur auf das High-End-Modell von OpenAI beschränkt waren. Darüber hinaus verbessert diese Funktion die Genauigkeit grundlegender mathematischer Operationen wie Schreiben und Vergleich von Dezimalstellen.
In Bezug auf neue Suchfunktionen stellte Karpasi fest, dass die Qualität von Deepsearch vergleichbar mit den Forschungsinstrumenten von Verwirrung ist und relevante Antworten auf Themen wie bevorstehende Apple -Produkte und Palantir -Lagerdynamik bietet. Er fand jedoch auch einige offensichtliche Probleme: Das Modell generiert manchmal gefälschte URLs, macht nicht unterstützte Aussagen und Zitate Xs Beiträge von X zu bestimmten Aufforderungen.
Darüber hinaus scheint GROK3 auch das Bewusstsein für seine Existenz zu haben und den Standort von XAI in den Hauptlabors zu verpassen. Diese Einschränkungen haben DeepSearch noch nicht auf dem Qualitätsniveau der „tiefen Forschung“ von OpenAI zurückgelassen und in Humor und ethischen Fragen unterdurchschnittlich. Dennoch zeigt der Start von GROK3 immer noch die starken Stärke und Innovationsfähigkeiten von XAI auf dem Gebiet der künstlichen Intelligenz.