Das Gebiet der künstlichen Intelligenz hat einen großen Durchbruch eingeleitet, und Coheres gemeinnütziges Forschungslabor hat kürzlich ein multimodales KI-Modell namens Aya Vision veröffentlicht. Diese innovative Leistung hat in der Branche weit verbreitete Aufmerksamkeit auf sich gezogen und wird von Cohere als eine der fortschrittlichsten Technologien bezeichnet.

AYA Vision zeigt eine hervorragende Vielseitigkeit, die komplexe Aufgaben erledigen kann, einschließlich Bildbeschreibungsgenerierung, fotolbezogenen Fragen, Textübersetzung und abstrakter Schöpfung in 23 Hauptsprachen. Um die globale wissenschaftliche Forschung zu fördern, bietet Coher diese Technologie kostenlos über die WhatsApp-Plattform, damit Forscher auf der ganzen Welt auf einfache Weise auf diese hochmoderne Leistung zugreifen und sie nutzen können.

Cohere wurde in seinem offiziellen Blog hervorgehoben, dass es trotz erheblicher Fortschritte in der KI -Technologie immer noch erhebliche Lücken in der mehrsprachigen Verarbeitung und multimodalen Aufgaben gibt. Die Forschung und Entwicklung von Aya Vision besteht darin, diesen technischen Engpass zu durchbrechen und die Weiterentwicklung künstlicher Intelligenz in den Bereichen Cross-Language und Cross-Modalität zu fördern.
Das Modell ist in zwei Versionen erhältlich: Aya Vision32b und Aya Vision8b. Unter ihnen hat AYA Vision32B in mehreren visuellen Verständnis-Benchmarks gut gespielt und sogar größere Wettbewerbsmodelle übertrifft, darunter die Lama-3,290b-Vision von Meta. Das AYA Vision8b hat auch gut abschneidet und die Modelle in einigen Bewertungen zehnmal so groß wie sie.

Diese beiden Modelle wurden auf der Umarmung der KI-Entwicklungsplattform veröffentlicht und unter dem Creative Commons4.0 lizenziert. Benutzer unterliegen den akzeptablen Nutzungsbedingungen von Cohere und beschränken sich auf nicht kommerzielle Verwendung.
In Bezug auf die Trainingsmethoden nimmt Cohere einen innovativen "diversifizierten" englischen Datensatz an, um Modelle durch Übersetzung und synthetische Annotationstechniken zu schulen. Diese synthetische Annotationstechnologie wird von KI erzeugt. Obwohl es bestimmte Einschränkungen aufweist, wurde es von vielen führenden Institutionen, einschließlich Openai, übernommen, was das Potenzial zur Verbesserung der Modellleistung zeigt.
Cohere sagte, dass der Einsatz von synthetischer Annotationstechnologie nicht nur die Schulungseffizienz verbessert, sondern auch den Ressourcenverbrauch erheblich verringert, was die doppelten Vorteile des Unternehmens bei der technologischen Innovation und der Ressourcenoptimierung widerspiegelt.
Um eine eingehende Forschung zu unterstützen, hat Cohere auch AyavisionBench, ein neues Benchmark-Bewertungsinstrument, auf den Markt gebracht. Das Tool wurde entwickelt, um die Leistung des Modells in visuellen und sprachkombinierten Aufgaben wie Bilddifferenzerkennung und Screenshot-to-Code-Komplex-Funktionen zu bewerten.
Vor dem Hintergrund der aktuellen "Bewertungskrise" in der künstlichen Intelligenzbranche bietet der Start von AyavisionBench einen umfassenderen und herausfordernden Rahmen für die Modellbewertung, der voraussichtlich Innovationen in der Branchenbewertungsstandards fördern wird.
Offizieller Blog: https://cohere.com/blog/aya-vision