Die rasante Entwicklung der generativen KI, insbesondere der GPT-Modellreihe, hat in vielen Bereichen neue Möglichkeiten eröffnet. Von der erheblichen Verbesserung der Ergebnisse bei Anwaltsprüfungen bis hin zur Anwendung im Geschäftsfeld hat GPT-4 seine leistungsstarken Fähigkeiten unter Beweis gestellt. Einige Branchenexperten haben jedoch die Verständnisfähigkeit und Zuverlässigkeit der aktuellen generativen KI in Frage gestellt und sind der Ansicht, dass ihre Denkfähigkeit und ihr Verständnis der Welt immer noch unzureichend sind und die zukünftige Entwicklung noch vor vielen Herausforderungen steht. Der Herausgeber von Downcodes führt Sie eingehend in die zukünftige Entwicklungsrichtung der generativen KI sowie in die Chancen und Herausforderungen ein, denen sich die heimische generative KI-Branche gegenübersieht.
Wo liegt die zukünftige Entwicklungsrichtung generativer KI?
Es ist unbestreitbar, dass das aktuelle GPT-4 in vielen Funktionen erheblich verbessert wurde. Im Vergleich zu GPT-3.5 wurde die Leistung von GPT-4 in komplexen Berufsfeldern erheblich verbessert, und auch seine Fähigkeit zum logischen Denken ist stärker. Bei der US-amerikanischen Anwaltsqualifikationsprüfung kann die Punktzahl von GPT-4 die besten 10 % erreichen, aber GPT-4 3,5 kann nur das untere 10 %-Niveau erreichen.

Bildquelle: Open AI
Durch die erhebliche Leistungsverbesserung eröffnet Chat GPT auch mehr Nutzungsszenarien. Derzeit bietet Open AI offiziell mehrere wichtige Anwendungsszenarien an, z. B. das Hinzufügen von KI zu Duolingo, um täglich mit Benutzern zu chatten, um das Sprachenlernen der Benutzer zu beschleunigen. Morgan Stanley verwendet GPT-4, um seine Wissensdatenbank zu verwalten und Mitarbeitern einen schnellen Zugriff zu ermöglichen Inhalte, die Sie wollen.
Viele große Namen haben jedoch Zweifel an den aktuellen Fähigkeiten von GPT. Stuart Russell wies in seiner Rede darauf hin, dass Chat GPT und GPT-4 weder die Welt verstehen noch Fragen beantworten. Das aktuelle große Sprachmodell ist nur ein Teil des Puzzles und was Wie es irgendwann aussehen wird, ist ungewiss. Viele Leistungsmängel deuten auch darauf hin, dass die Entwicklung allgemeiner künstlicher Intelligenz noch weit entfernt ist. Aufgrund verschiedener Zweifel an den Fähigkeiten von GPT-4 modifizierte Stuart Russell während Sam Altmans Rede auch das PPT.

Bildquelle: Weisheitskonferenz
Die gleiche Ansicht wie Stuart Russell vertritt auch Yang Likun, Gewinner des Turing Award, einer der „Großen Drei des Deep Learning“ und Chefwissenschaftler für künstliche Intelligenz bei Meta. Er glaubt, dass es dem aktuellen autoregressiven Modell von GPT an Planung mangelt seine Argumentationsfähigkeit Es ist derzeit nicht möglich, das Fehlerproblem zu lösen, wenn der Eingabetext zunimmt, und die Fehlerwahrscheinlichkeit steigt ebenfalls exponentiell.
Tatsächlich sind die Vorwürfe der beiden Großen gegen GPT nicht unbegründet. Da der von Chat GPT selbst verwendete RLHF-Algorithmus auf der menschlichen Wahrnehmung beruht, ermöglicht er dem Modell, die Qualität seiner eigenen Antworten zu beurteilen und sich selbst zu trainieren, um nach und nach qualitativ hochwertigere Antworten zu geben. Wenn Sie die Argumentationsfähigkeit des Modells verbessern möchten, müssen Sie eine große Anzahl von Parametern in der Datenbank ergänzen und den Algorithmus kontinuierlich iterieren.

Quelle: Southwest Securities
Das Vorhandensein verschiedener Risiken hält jedoch auch viele generative KI-Unternehmen davon ab, es einfach zu versuchen. Wenn generative KI die gleiche Fähigkeit zum Erzählen von Geschichten und zur Schaffung von Charakteremotionen erreichen kann wie ein Romanautor, wird die generative KI dann völlig außerhalb der menschlichen Kontrolle liegen? Während dies weltweite Panik auslöst, wird es aber auch einer strengen Aufsicht durch lokale Regierungen ausgesetzt sein, was dazu führt, dass bisherige Investitionen in generative KI vergeblich sind?
Hinsichtlich der zukünftigen Entwicklungsrichtung der generativen KI lautet die Antwort von Yang Likun: Weltmodell. Dieses Weltmodell ist nicht nur ein Modell, das das menschliche Gehirn auf neuronaler Ebene imitiert, sondern auch ein Weltmodell, das die Partitionen des menschlichen Gehirns in Bezug auf kognitive Module vollständig erfüllt. Der größte Unterschied zwischen ihm und dem großen Sprachmodell besteht darin, dass es dies kann über Planungs- und Vorhersagefähigkeiten (Weltmodell) und Kostenkalkulationsfähigkeiten (Kostenmodul) verfügen.
Mit Hilfe des Weltmodells können wir die Welt besser verstehen und die Zukunft vorhersagen und planen, kombiniert mit einer einfachen Nachfrage (die Zukunft muss nach der Logik geplant werden, die die meisten Aktionskosten spart). Es kann alle potenziellen Gifte und unnötigen Folgen beseitigen.

Bildquelle: Weisheitskonferenz
Das Problem besteht jedoch darin, dass die Parameter, Algorithmen, Kosten usw. des Weltmodells während des Trainings lediglich einige strategische Ideen gegeben haben. Zum Beispiel die Verwendung selbstüberwachter Modelle zum Trainieren und Etablieren von mehrstufigen Denkmodellen usw., aber Yang Likun konnte keinen vollständigen Plan für die Umsetzung vorlegen.
Andere Teilnehmer teilten ihre Ansichten zur zukünftigen Entwicklungsrichtung der generativen KI nicht. Daher wird die nachfolgende generative KI immer noch eine Situation aufrechterhalten, in der jedes Unternehmen „sein eigenes Ding macht“ und eine global einheitliche generative KI möglicherweise nur im Laborstadium bleibt.
03. Inländische generative KI-Vorhersage
Professor Huang Tiejun, Präsident des Zhiyuan Research Institute, sagte in einem Interview mit den Medien nach dem Treffen, dass das aktuelle Problem bei inländischen großen generativen KI-Modellen darin bestehe, dass die Branche überhitzt sei, die Trainingsdaten jedoch zu klein seien und sich auf mehrere zehn Milliarden belaufen würden der Modelle sind gerade erst im Entstehen. Obwohl sie aufgrund sich wiederholender Anstrengungen über einige technische Fähigkeiten verfügen und die Ressourcen der Industrie zunehmend verteilt werden, besteht immer noch eine gewisse Lücke zwischen ihrem Intelligenzniveau und großen ausländischen generativen KI-Modellen.
Nehmen Sie, wie Professor Huang Tiejun sagte, als Beispiel das große Modell „Tongyi Qianwen“ von Alibaba, da es sich bei den zum Training dieses großen Modells verwendeten Daten um eine große Anzahl chinesischer Gespräche und Gespräche handelt, die aus Alibabas Taobao, Alipay, Tmall und anderen Branchen extrahiert wurden Die Menge der vorab trainierten Daten für Textdaten sowie Textdaten aus einigen anderen Quellen beträgt etwa 200 Milliarden Wörter, was 14 TB Textdaten entspricht.
Das Trainingsdatenvolumen von Chat GPT beträgt etwa 4,5 Milliarden Wörter, was 300 GB Textdaten entspricht. Da die Trainingsdaten relativ klein sind, mangelt es auch Alibabas „Tongyi Qianwen“ an multimodalen Fähigkeiten. Textlich liegen beide weit hinter GPT-4 zurück.
Laut Daten des vom InfoQ Research Center veröffentlichten „Large Language Model Comprehensive Capability Evaluation Report 2023“ führt Chat GPT derzeit andere inländische große Modellhersteller mit einem Gesamtwert von 77,13 % an.

Quelle: „Large Language Model Comprehensive Ability Evaluation Report 2023“
Gleichzeitig wies Professor Huang Tiejun auch darauf hin, dass die heutigen Großmodelle ein Zwischenprodukt der technologischen Iteration seien. Mit der anschließenden Entwicklung der inländischen Großmodellindustrie beträgt die angemessene Anzahl großer Modellökosysteme, die in Zukunft überleben können, etwa drei .
Wie Professor Huang Tiejun sagte, wies Ma Huateng bei einem hochrangigen Treffen innerhalb von Tencent darauf hin, dass die Dividenden aus dem C-End-Markt in den nächsten zehn Jahren verschwinden werden. Die gesamte Hoffnung liege auf dem ToB-End-Markt und der zweiten Hälfte des Internets gehört zum industriellen Internet. Das Ali Business Research Institute hat bereits zuvor darauf hingewiesen, dass die nächsten zehn Jahre eine goldene Chance für die Transformation traditioneller Unternehmen sein werden.
Aus der Sicht des ToB-Marktes muss jedoch unter Berücksichtigung des sich seit vielen Jahren entwickelnden SaaS-Marktes, wenn ein großes Modell den ToB-Markt wirklich öffnen möchte, der Kern darin bestehen, den Wert „Kostenreduzierung und Kostenreduzierung“ zu bringen „Effizienzsteigerung“ für die Kunden, insbesondere in der aktuellen Zeit der Unsicherheit. Dies gilt insbesondere dann, wenn einige Branchen bei großen Modellen noch am Rande bleiben. Vor allem in der traditionellen verarbeitenden Industrie sind die aktuellen Probleme, mit denen kleine und mittlere traditionelle verarbeitende Industrien konfrontiert sind, reduzierte Bestellungen, die Branche kämpft in Preiskämpfen und nachgelagerte Zahlungseinzugszyklen sind bei vielen kleinen und mittleren verarbeitenden Unternehmen länger geworden Branchen haben derzeit Schwierigkeiten, ihren Lebensunterhalt zu bestreiten. Um hohe Trial-and-Error-Kosten zu vermeiden, trauen sich viele kleine und mittelständische Fertigungsbetriebe naturgemäß nicht ohne weiteres an den Einsatz großer Modelle.
Und der Entwicklungsgeschichte der SaaS-Branche nach zu urteilen, erreichte die heimische SaaS-Branche 2015 einen Wachstumshöhepunkt, nachdem sie seit Anfang 2004 zehn Jahre lang Ruhe erlebt hatte. Seit dem Ausbruch der Epidemie im Jahr 2020 hat die Epidemie die digitale Transformation von Unternehmen beschleunigt und der heimische SaaS-Markt ist in eine kritische Wachstumsphase eingetreten. Dennoch ist das aktuelle Ökosystem der heimischen SaaS-Branche noch nicht vollständig und der Markt noch nicht ausgereift.
Bildquelle: Flash Cloud
Offensichtlich geschieht die Öffnung des TOB-Marktes für große Modelle nicht über Nacht, sondern ist ein äußerst langsamer Prozess. Darüber hinaus erfordern die Kosten für Algorithmen, Rechenleistung und Daten während der Modelliteration, einschließlich der anschließenden Einführung verschiedener Funktionen, dass große Modellunternehmen kontinuierlich hohe Mittel investieren.
Die Kommerzialisierung dauert lange, der Kapitaleinsatz ist hoch und es ist schwierig, kurzfristig Gewinne zu erzielen. Unternehmen, denen es an Cashflow mangelt, werden angesichts des finanziellen Drucks in Zukunft keine andere Wahl haben, als ihre eigenen großen Modelle zu schließen , und es wird noch schwieriger, die Ressourcen der Industrie auf Hersteller von Großkopfmodellen zu konzentrieren.
Nach den Erfahrungen vieler Branchen wie Online-Mitfahrdienste und Lebensmittellieferungen zu urteilen, können sich nach vielen Jahren des Aufruhrs in einer aufstrebenden Branche in Zukunft nur etwa drei Unternehmen wirklich weiterentwickeln, und viele andere Unternehmen sind in der Geschichte untergegangen langer Fluss.
Alles in allem befindet sich die generative KI in einer Phase rasanter Entwicklung, die sowohl Chancen als auch Herausforderungen mit sich bringt. In Zukunft könnten Weltmodelle eine wichtige Entwicklungsrichtung werden, ihre Umsetzung steht jedoch noch vor vielen technischen und kommerziellen Problemen. Die heimische generative KI-Branche muss auch Probleme wie Datenumfang und Kommerzialisierung lösen, um im harten Wettbewerb hervorzustechen. Der Herausgeber von Downcodes wird die Trends in diesem Bereich weiterhin im Auge behalten und den Lesern weitere spannende Inhalte bieten.