modèles géniaux génératifs
Une liste organisée de frameworks, bibliothèques, logiciels et ressources génératifs impressionnants
Inspiré par Awesome-Python

Mon travail open source est soutenu par la communauté
- MDELS génératifs géniaux
- Génération de code: algorithme ML + analyse statique
- Code à GUI: Algorithme à l'interface utilisateur
- Synthèse d'image
- Transfert de style d'image
- Génération de texte / NLP
- Génération / traitement de l'audio et de la musique
- Synthèse musicale-vidéo
- Vidéo-synth
- Génération procédurale pour le jeu
- Génération d'image
- Forum
Code vers GUI: Algorithme vers l'interface utilisateur:
- Capture d'écran en code
- PIX2CODE: Génération de code à partir d'une capture d'écran d'interface utilisateur graphique
- Bred Victor: Machine Learning in Engineering Inférence de l'environnement
Génération de code: algorithme ML + analyse statique
- Tabnine: Actionnement automatique avec apprentissage en profondeur
- Kite: Algorithme Assisté Coders Achèvement
- INSIGNT: Les outils d'achèvement du code standard utilisent souvent encore un tri alphabétique, tandis que Kite utilise des algorithmes ML pour déduire ce qu'un développeur essaie probablement de faire
Synthèse d'image
- Spade par NVLABS: synthétiser des images photoréalistes étant donné une disposition sémantique d'entrée. code
Transfert de style d'image
ArtBreeder basé sur des modèles Biggan OpenSource Version Biggan Modèles sur
Un projet artistique cool: ... DGSPitzer (Eddie Hu) Un fabricant de jeux indépendant utilise ArtBreeder basé sur des modèles Biggan, Stylegan-Artm Relitics-neural_talking_head_modelsm First-Order_Modelsm Dain et Topaze Lab pour un excellent travail sur la réparation de vidéo numérique, qui colorise le noir et pendant que la vidéo.
Un projet sympa: un roman visuel utilisant le transfert de style ML
NLP: analyse de texto-sentiment:
- Deepmoji: un modèle d'analyse des sentiments Ce modèle également utilisé dans 15.ai, un outil de texte vocal pour générer des voix de différents caractères.
Texte à l'image:
- ensemble de données: le jeu de données open source de Google de Google GitHub
Texte à vidéo:
- ALLENNLP: Imaginez ceci! Scripts aux compositions aux vidéos
Sous-titrage d'image
- TensorFlow Core: Cention d'image avec une attention visuelle
Texte à l'animation
- Génération d'animations à partir de scénarios
Génération de texte / NLP
Génération de questions:
- Génération de questions: générer des réponses à choix multiples à partir du texte
Autre
- Openai 1,5 milliard de paramètres GPT-2 Release
- Aidungeon
- CTRL-GCE: Modèle de génération de texte CTRL sur Google Compute Engine avec seulement quelques commandes de console., Pourquoi Google Compute Moteur: Le modèle CTRL est si grand (12 Go sur disque, 15,5 Go de GB GPU VRAM lorsqu'il est chargé, encore plus de RAM système pendant l'exécution) qu'il ne s'adaptera actuellement pas à un livreur de colaboratoire ou Kaggle gratuit.
- L'écriture avec l'ensemble de données Machine SciFi Corpus TXT pourrait être utile pour le modèle GPT2 Fine Taul
- Gpt2-chinois-wuxiao-novel
- GPT-2 chinois
- [TRANSFORMATION DE VACHEMENTS Étreinte] -PYTORCH HUB
Texte corpus / ensemble de données
- Sci-Fi-Script
- Detroit-Becoming Human pourrait être source pour analyser la structure des arbres de dialogue et des arbres de décision.
Génération / traitement de l'audio et de la musique
Projet:
- Parler comme votre personnage préféré: Recherche liée à la génération audio de la parole de texte:
- Tacotron2
- ForwardTacotron: Tacotron2 sans attention
- Clone vocale: la voix en temps réel
- Spleeter: Sound Track Sépération La séparation du son est sous le domaine de Music Information Retrival.
- Musique générative ambiante d'Alex Bainter Bien que ce projet ne soit pas généré par l'algorithme, donne beaucoup d'inspiration dans le domaine de la génération de musique. Code moyen * Neuralfunk: conception sonore avec ML
Synthèse musicale-vidéo
- Visualiseur musical profond utilisant le code biggan
Synthèse et génération vidéo:
PIX2PIX-TENSORFLOW: POWEED INTERATIVE RENDEDEED CODE VIRTUAL CODE MISE À JOUR: MODÈLE PRÉTRATED Ajouté plus sur Colab
- En utilisant cette technique, nous pouvons colorer les photos en noir et blanc, convertir Google Maps en Google Earth, etc.
Craft, qui génère des dessins animés basés sur le texte descritpionsa un travail très créatif impliquait du texte à la génération vidéo à partir de la page NLP du chercheur du chercheur
Système audio
- Implémentation de Pytorch Taco2 de Nvidia
- vocier en temps réel
Procédural Génération pour
Génération de cartes
- Générateur de cartes fantastiques procédural alimenté par AI, référence: @ Linonetwo's Blog
Animation
- Apprentissage en profondeur pour l'animation et le contrôle des personnages
- Deepmimic: imitation de mouvement avec un apprentissage en renforcement profond
Formation distribuée:
- MPI réduit et Allreduce Tutorial très utile pour illustrer le concept de MPT. Vérifier le code
- Vérifiez également TensorFlow-Core
- Stratégie de transmission distribuée
Application de vision par ordinateur dans le jeu
- Scoutisme de talents de sports électroniques basé sur l'acquisition de données de données Twitch Multimodal Twitch Acquisition et modélisation du journal de chat de code Twich Stream
Papier avec code
Ressources sur le cours connexe:
- UIUC CS598RK: HCI pour ML
- Coursera: Modèles de séquence
- Apprentissage en profondeur complète
- jeûne.ai
- UIUC: laboratoire de traitement vidéo ECE420
- GPU Ressource GRATUIT: Configuration d'une instance Google Cloud GPU pour FAST.ai gratuitement
Configuration du cloud computing
Outils d'apprentissage en profondeur complète dans le pipeline de traitement des données:
- Cortex: déploier des modèles d'apprentissage automatique dans la production peut-être sans Docker et Kubernetes Medium
Ressources pour l'outil de développement:
- Lumen: logiciel vidéo Syth
- Éditeur de nœuds basé sur l'arbre de dialogue pour l'unité et la démo d'exemples
Plus de ressources sur le modèle pré-entraîné:
- [Pytorch Hub] https://pytorch.org/hub/research-models
- Tensorflow Hub
Rencontrez des personnes liées à l'esprit dans le forum:
Application:
Génération de voix de différents caractères: idéalement podcast et jeu, etc.:
Réalisation de films:
- Black Mirror: Bandersnatch Show Case: Tree de dialogue
- Décalage
Conception
- Conception pilotée par algorithme
- Logo généré algorithme
Référence:
- Pour plus de détails sur la façon de représenter l'architecture d'animation du point de vue du logiciel et en mathématiques. Vérifiez le Chapitre11-Animation System of Game Engine Architecture, 2e édition de Jason Gregory
- Le nouveau modèle d'IA de Kite