L'équipe de l'intelligence artificielle de New York, nous recherchons, connu pour son modèle de langue "personnalisé et illimité", a récemment lancé une toute nouvelle API de raisonnement de modèle. Cette décision marque l'organisation de l'IA, qui a toujours été connue pour son "indiscipliné", qu'elle a commencé à fournir son modèle de langage fier à un plus large éventail de développeurs et de chercheurs à travers des interfaces programmatiques.
Les recherches sur les États-Unis ont toujours contesté les "chaînes" de grandes entreprises d'IA telles que OpenAI et anthropic, et leurs slogans sont pleins de "libéralisme". Maintenant, ils ont décidé d'emballer cette "liberté" dans une API afin que plus de gens puissent en faire l'expérience. Le premier lot d'API est équipé de deux produits de célébrités: le modèle général des poids lourds Hermes3llama70b basé sur l'architecture Meta Llama3.1, et l'aperçu Deephermes-38B publié le mois dernier, qui peut basculer de manière flexible entre la réponse standard et la "chaîne de pensée" détaillée.
Cependant, essayer ce "AI Express" n'est pas aussi simple que de passer directement un ordre. La recherche DOUS utilise un système de liste d'attente du premier arrivé premier servi et offre un crédit gratuit de 5 $ pour chaque nouveau compte. D'une part, cette opération consiste à répondre à la demande de pointe possible, et d'autre part, c'est aussi une méthode de marketing intelligente, créant un "sentiment de rareté", ce qui rend les gens plus curieux de savoir ce qu'ils vendent.
Fait intéressant, bien que les recherches sur les États soient "uniques", il choisit de s'aligner sur le modèle de conception d'API d'Openai dans la conception de l'API, y compris les interfaces de complétion et de discussion de chat. Il s'agit d'une connexion transparente pour les développeurs qui connaissent déjà l'interface OpenAI, et peuvent facilement intégrer les modèles de nous dans leurs applications. Cela reflète que si nous adhère à sa propre philosophie, il montre également des considérations commerciales pragmatiques.
Il y a à peine quatre mois, nous venons de lancer son premier chatbot d'interface utilisateur, le chat nous. Avant cela, ils se sont concentrés sur la libération de modèles open source que les utilisateurs peuvent se déployer localement. Dans le passé, si les utilisateurs voulaient déployer ces modèles, ils devaient télécharger le code eux-mêmes et l'exécuter localement. Ce fut sans aucun doute un "travail physique" long, fastidieux et peut-être cher. Maintenant, via les API, les développeurs peuvent utiliser directement des modèles haute performance sans se soucier de l'infrastructure. Cela marque un pas en avant important pour la recherche sur nous d'un modèle purement open source à un modèle commercial plus durable.
Le lancement de l'API reflète les efforts de la recherche de nous pour poursuivre la commercialisation tout en adhérant au principe open source. Tout en exposant des poids du modèle, ils génèrent des revenus grâce à un déploiement commercial. Ce modèle hybride est évidemment destiné à attirer différents groupes d'utilisateurs: les développeurs et les chercheurs individuels peuvent toujours télécharger et exécuter des modèles gratuitement, tandis que ceux qui poursuivent la fiabilité, la commodité et l'optimisation des performances peuvent choisir d'utiliser l'API pendant un temps payé.
Au fil du temps, les recherches sur les États-Unis ont déclaré que leur service d'inférence continuera de se développer et pourrait inclure des modèles plus présentés, tels que Hermes2Pro, qui est bon dans les appels de fonction, et leur projet de psyché. Pour les startups d'IA qui innovent en fonction des modèles open source, l'API de la recherche de Nous Research fournit sans aucun doute une nouvelle option, brisant le paysage existant, exacerbant potentiellement la concurrence dans le domaine du raisonnement de l'IA et de la conduite d'une technologie plus approfondie.
Entrée: https://portal.nousresearch.com/login