Auf dem Gebiet der künstlichen Intelligenz zeigt KI nicht nur herausragende Intelligenz in Schachspielen, sondern zeigt auch erstaunliche Fähigkeiten in sozialen Spielen voller Strategien und Täuschungen wie "Werwolf -Töten". Vor kurzem hat ein KI "Werwolf Kill" -Benchmark-Test mit dem Titel "Elimination Game" weit verbreitete Aufmerksamkeit erregt, und die Testergebnisse sind schockierend: GPT-4,5 fällt in diesem sozialen Spiel auf und hinterlässt Konkurrenten wie Claude 3.7 Sonnet und Deepseek R1 weit dahinter. Mit diesem Ergebnis fragen sich die Menschen, ob die soziale Intelligenz von AI ein unglaubliches Niveau erreicht hat.
Die Regeln für das „Ausscheidungsspiel“ sind äußerst schwierig: Bis zu acht Spieler (einschließlich KI -Modelle und Live -Spieler) nehmen teil und beseitigen eine Person in jeder Runde durch Abstimmung, bis zwei Überlebende übrig sind. Komplizierterer werden die eliminierten Spieler eine "Jury" bilden, um den letzten Gewinner zu entscheiden. Dieser Mechanismus macht das Spiel voller Verrat, Täuschung und Strategie und kann als AI -Version von "Game of Thrones" bezeichnet werden.

Während des Spiels können Spieler im öffentlichen Chat -Raum heftige Debatten führen, die sich um Vorteile bemühen, indem sie Meinungen erläutern, die Herzen der Menschen gewinnen und Gegner verwirrt. Neben der öffentlichen Kommunikation können Spieler auch private Chats, geheime Allianzen oder Fallen setzen. In nur drei Runden privater Chats erreichte die Menge an Informationen und Strategie ein extrem hohes Niveau. Die Spieler müssen ein Gleichgewicht zwischen Vertrauen und Täuschung finden, und wenn sie nicht vorsichtig sind, können sie beseitigt werden.
Wenn das Spiel in den letzten Showdown eintritt, werden die verbleibenden beiden Spieler ihre letzten Abschiedsreden halten und versuchen, die eliminierte "Jury" zu überzeugen, sich selbst zu unterstützen. Letztendlich wird die Jury darüber abstimmen, wer der einzige Gewinner ist. Dieser Link testet nicht nur Fähigkeiten der Sprachausdrucks der Sprache, sondern auch ihre Überzeugung und Strategie.

Wie treten Hauptmodelle in dieser wilden KI -Schlacht "Wewolf Killing" auf? Die Testergebnisse sind beeindruckend:
Mit seiner hervorragenden Fähigkeit und Strategie für soziale Argumente ist GPT-4,5 zu einem wohlverdienten "König" geworden. Es zeigt extrem niedrige Verrat -Raten im Spiel und neigt dazu, durch Allianzen und Zusammenarbeit einen Vorteil zu erzielen. In der letzten Phase zeigte GPT-4,5 eine erstaunliche Überzeugung, gewann erfolgreich die Unterstützung der Jury und stach schließlich mit einer Siegesrate von 62,6% auf.
Claude3.7Sonnet zeigt flexible und veränderliche Strategien. Obwohl es GPT-4,5 in sozialen Denken und Täuschungsmöglichkeiten etwas unterlegen ist, funktioniert es immer noch gut. Es war leicht, zwischen Zusammenarbeit und Verrat zu gehen, und belegte schließlich den zweiten Platz mit einer Gewinnrate von 59,3%.
Deepseek R1 verfolgte eine radikalere Strategie, obwohl es in einigen Stadien gut abschneidet, aber in sozialen Strategien und verbalem Ausdruck etwas nicht ausreichte und schließlich mit einer Gewinnrate von 53,8%auf Platz Platz belegte.
Diese Benchmark "Elimination Game" zeigt nicht nur das enorme Potenzial der KI in der sozialen Intelligenz, sondern freuen uns auch auf die zukünftige Entwicklung der KI. Mit der kontinuierlichen Weiterentwicklung der KI -Technologie, vielleicht in naher Zukunft, wird AI den Menschen in mehr Bereichen übertreffen und ein unverzichtbarer Teil unseres Lebens werden. Dieser KI -Krieg "Wewolf Killing" ist nur der Beginn der Ausweitung der intelligenten KI -Grenzen. Die Überraschungen und Schocks der Zukunft können weit über unsere Vorstellungskraft hinausgehen.