Inteligencia artificial aplicada y aprendizaje automático
Introducción
Applied AI es un repositorio de conocimiento curado de casos de uso de inteligencia artificial y aprendizaje automático, mejores prácticas, lecciones aprendidas, herramientas y técnicas, adoptada por la tecnología líder o las organizaciones expertas en tecnología.
Numerosas organizaciones frecuentemente comparten sus ideas y experiencia, abarcando las mejores prácticas, herramientas y técnicas que dan forma a su cultura de ingeniería. Lo hacen a través de varias plataformas públicas, como blogs de ingeniería, conferencias y reuniones. Este repositorio compila y presenta contenido recopilado de estas fuentes.
Temas
- Inteligencia artificial
- Aprendizaje automático
- Aprendizaje profundo
- IA generativa
- Modelos de idiomas grandes
- Ingeniería rápida
- Generación de recuperación de generación (trapo)
- Mlops
- Ingeniería de datos
- AI responsable
Organizaciones
Airbnb
Publicaciones de blog
2024
- Tour fotográfico con AI a Airbnb usando Vision Transformer
- Plataforma de automatización V2: Mejora de la IA conversacional en Airbnb
- Transformación de la recuperación de ubicación en Airbnb: un viaje desde la heurística hasta el aprendizaje de refuerzo
- Chronon, la plataforma de funciones ML de Airbnb, ahora es de código abierto
- Brandómetro Airbnb: Medición de percepción de marca de alimentación en datos de redes sociales con IA
2023
- Priorizar los atributos del hogar basados en el interés de los invitados
- Aprender a clasificarse diversamente
- Construyendo categorías de Airbnb con ML y Human en el bucle
- Sabiduría de datos no estructurados: construir el conocimiento de la lista de Airbnb a partir de datos de texto grandes
2022
- Cómo los modelos de generación de texto de IA están remodelando el soporte al cliente en Airbnb
- Plataforma de automatización inteligente: empoderamiento de IA conversacional y más allá en Airbnb
2021
- Automatizar la protección de datos a escala, Parte 2
2020
- Mejorar el aprendizaje profundo para el ranking estades en Airbnb
Algolia
Publicaciones de blog
2024
- Introducir la personalización de IA (?)
- Cómo los modelos de gran lenguaje están cambiando de comercio electrónico
- ¿Qué significa para la búsqueda de AI para "comprender" a los clientes?
- El futuro de B2B funciona con AI. Aquí le mostramos cómo comenzar.
- La guía definitiva de los motores de búsqueda semántica
2023
- Spotlight de características: sugerencias de consultas
Altera.ai
Publicaciones de blog
2024
- Altera utiliza GPT-4O para construir una nueva área de colaboración humana
Asana
Publicaciones de blog
2024
- Gestión laboral de sobrealimentaciones de asana con Claude
ASOS
Publicaciones de blog
2024
- ASOS TECH Genai Hack: Requisitos de revoluciones con Genai
- Transformando recomendaciones en ASOS
Autotradante
Publicaciones de blog
2024
- Desmitificante de modelos de idiomas grandes (LLM101)
- A la aplicación o no a la aplicación (prototipos de aplicaciones de datos rápidos en el ciclo de experimentación de ML)
- Tantas etiquetas, tan poco tiempo; Acelerar nuestro proceso de etiquetado de imágenes
2023
- Demostrando el valor de nuestros paquetes
2022
- Personalización en tiempo real de los resultados de búsqueda con la plataforma de datos de clientes de Auto Trader
Blabkacar
Publicaciones de blog
2023
- Cómo utilizamos el aprendizaje automático para combatir el fraude en Blablacar - Parte 1
- Cómo construimos nuestra tubería de aprendizaje automático para combatir el fraude en Blablacar - Parte 2
- Cómo BLABLACAR aprovecha el aprendizaje automático para que coincida con pasajeros y conductores - Parte 2
- Cómo BlableCar aprovecha el aprendizaje automático para que coincida con los pasajeros y los conductores - Parte 1
Fundación Brian Impact
Publicaciones de blog
2024
- Brian Impact Foundation impulsa su búsqueda de la próxima generación de innovadores sociales con Claude
Lienzo
Publicaciones de blog
2024
- El estudio de magia con IA de Canva usó 5 mil millones de veces y contando.
2023
- Resumiendo las revisiones de los incidentes de la publicación con GPT-4
Coinbase
Publicaciones de blog
2024
- Coinbase mejora la atención al cliente y la eficiencia operativa con Claude
Dropbox
Publicaciones de blog
2024
- Adiós adiós ...: evolución de los ataques de token repetidos en los modelos de chatgpt
- Traer respuestas y resúmenes a IA a vistas previas de archivos en la web
- Desde la IA hasta la sostenibilidad, ¿por qué nuestros últimos centros de datos utilizan networking 400G?
2023
- Poner todo en su lugar correcto con la organización de archivos con motor ML
- ¿Es esta una fecha? Uso de ML para identificar formatos de fecha en los nombres de archivo
- ¿No (olvides NLP): inyección rápida con caracteres de control en chatgpt
- Acelerar nuestros experimentos A/B con aprendizaje automático
2021
- Optimización de pagos con aprendizaje automático
- Cómo funciona la búsqueda de imágenes en Dropbox
- Cannes: Cómo ML ahorra US $ 1.7 millones al año en vistas previas de documentos
eBay
Publicaciones de blog
2024
- La herramienta de mejora de fondo convierte cualquier foto en una imagen de producto de calidad de estudio
- Los principios de IA responsables de eBay
- Reducir el ruido: tres cosas que hemos aprendido sobre la IA generativa y la productividad del desarrollador
- Podcast: Nitzan Mekel-Bobrov en AI, el futuro de las compras en línea y el valor de la construcción interna
2023
- El nuevo generador de subtítulos sociales utiliza IA para ayudar a los vendedores a publicar más fácilmente
- eBay Ejec de cómo la inteligencia artificial traerá un 'cambio de paradigma' al comercio electrónico
- La herramienta de listado 'mágica' aprovecha el poder de la IA para hacer que la venta en eBay sea más rápido, más fácil y precisa
- Recomendaciones en evolución: un modelo de clasificación personalizado basado en el usuario
- Beyond Words: cómo las integridades multimodales elevan las recomendaciones de productos de eBay
- Ejecutivos de eBay hablan de IA generativa y visión por computadora en VentureBeat Transform Conference
- EBAY's Blazenty Fast Billion a escala de similitud de similitud de similitud
- Cómo eBay creó un modelo de idioma con tres mil millones de títulos de artículos
2022
- Sherlock.io: un sistema de monitoreo de aprendizaje automático mejorado
- Mejora de las recomendaciones de compras para los clientes a través del modelo de Cascade de Relevancia de eBay
- Construyendo un sistema de recuperación basado en el aprendizaje profundo para recomendaciones personalizadas
Estee lauder
Publicaciones de blog
2024
- Belleza basada en datos: cómo las empresas Estée Lauder desbloquean las ideas con ChatGP
Etc.
Publicaciones de blog
2024
- Aprendizaje y evaluación de representación visual eficiente
2023
- Cómo construimos un ranker canónico de varias tareas para recomendaciones en Etsy
- Aprovechando las acciones del usuario en tiempo real para personalizar los anuncios de Etsy - Documento de investigación
- Desde la clasificación de la imagen hasta el modelado multitarea: la búsqueda de la búsqueda de Etsy por la imagen de Etsy
- Aprovechando las acciones del usuario en tiempo real para personalizar los anuncios de Etsy
2022
- Aprendizaje profundo para la clasificación de búsqueda en Etsy
Expedia
Publicaciones de blog
2024
- Aprendizaje de incrustaciones para alojamiento Conceptos de viaje
- Viajar con mucho más inteligente con Romie
- Elegir los candidatos adecuados para el ranking de alojamiento
2023
- Uso de datos de búsqueda sintética para los vuelos de pronóstico de precios
- Modelo de predicción de valor de por vida del cliente de Expedia Group
- Generando diversas recomendaciones de viaje
- Aumento de la participación de los viajeros a través de alertas de precios
- Generación candidata utilizando un enfoque de dos torres con datos de viajeros de Expedia Group
2022
- Categorizar los comentarios de los clientes utilizando el aprendizaje no supervisado
- Cómo optimizar las clasificaciones con los bandidos Cascade
2021
- Modelo de clasificación personalizado para alojamiento
Github
Blogs
2024
- Desbloquear el poder de los datos no estructurados con trapo
- ¿Qué es la generación de recuperación de la recuperación y qué hace para la IA generativa?
- Habilidades duras y blandas para los desarrolladores que codifican en la era de la IA
- Cómo funciona la generación de código AI
- Arreglar las vulnerabilidades de seguridad con IA
- El segundo cerebro de un desarrollador: reducir la complejidad a través de la asociación con IA
2023
- Cómo estamos experimentando con LLM para evolucionar Copilot Github
- La arquitectura de las aplicaciones LLM de hoy
- Dessystifying LLM: cómo pueden hacer cosas para que no fueron entrenados para hacer
- Cómo construir una aplicación Enterprise LLM: Lecciones de GitHub Copilot
- Una guía de desarrolladores para ingeniería rápida y LLMS
- Inside Github: Trabajando con los LLM detrás de Github Copilot
- Cómo las empresas están impulsando la productividad con IA generativa
- Cómo la IA generativa está cambiando la forma en que trabajan los desarrolladores
- Cumplimiento generativo para el desarrollo de software
- Lo que los desarrolladores necesitan saber sobre la IA generativa
2022
- Las nuevas y emocionantes características de Github alimentan el aprendizaje automático
Gitlab
Publicaciones de blog
2024
- Gitlab mejora la productividad con Claude
- Construyendo Gitlab con Gitlab: un servicio de múltiples regiones para entregar características de IA
Mierda
Blogs
2024
- Búsqueda generativa de dominio de IA
- De texto a transformadores: cómo los LLM están mejorando la experiencia CMS de GoDaddy
- LLM de las trincheras: 10 lecciones aprendidas en operacionalización de modelos en GoDaddy
- Todo lo que he aprendido construyendo una aplicación de IA
Agarrar
Publicaciones de blog
2024
- Búsqueda de similitud de vectores asistidos por LLM
- Aprovechando las LLM con trapo para tareas analíticas
- Evolución de la pasarela: plataforma de servicio modelo en Grab
- Habilitar el descubrimiento de datos de conversación con LLM en GRAB
- Revelando el proceso: la creación de nuestro poderoso constructor de campañas
- Clasificación de datos con alimentación de LLM para entidades de datos a escala
Goma
Publicaciones de blog
2024
- El equipo de Sports de soporte al cliente de Gumroad con Claude
Instacart
Publicaciones de blog
2024
- Mejora de la tormenta de alimentos con generación de imágenes de IA
- Serie de altavoces distinguidos con Ping Li: búsqueda de vectores dispersos mejorados con protección de privacidad
- Presente el núcleo de Griffin 2.0 de Instacart: una inmersión profunda en la plataforma de servicio modelo
- Eficiencia de desbloqueo: cómo AVA se convirtió en nuestro socio de productividad de IA
2023
- Un modelo para servirles a todos
- Monte Carlo, títeres y risas: las alegrías inesperadas de la rápida ingeniería
- Presente el núcleo de Griffin 2.0 de Instacart: una inmersión profunda en la plataforma de entrenamiento de aprendizaje automático
- Presentación de Griffin 2.0: la plataforma ML de próxima generación de Instacart
- Escala de productividad con AVA - Asistente de IA interna de Instacart
- Fundaciones de sobrealimentación de ML/AI en Instacart
- Adoptar DBT como la herramienta de transformación de datos en Instacart
- La próxima era de datos en Instacart
- Cómo Instacart modernizó la predicción de la disponibilidad en tiempo real para cientos de millones de artículos mientras ahorra costos
LinkedIn
Publicaciones de blog
2024
- Mejorar la gestión de la postura de seguridad de LinkedIn con ideas impulsadas por IA
- Debajo del capó: la tecnología detrás del primer agente de LinkedIn, Asistente de contratación
Mercado libre
Publicaciones de blog
2024
- Mercado Libre presenta a Verdi, una plataforma de desarrollador de IA impulsada por GPT-4O
- Acelerar el futuro impulsado por la IA con el gobierno de datos al volante
- Más allá de la exageración: lecciones e ideas del mundo real al trabajar con modelos de idiomas grandes
Mercari
Publicaciones de blog
2024
- Ajuste de un LLM para extraer atributos especificados dinámicamente
- Enfoque basado en LMM para la clasificación de categoría de elementos a gran escala
2023
- Categorización de consultas basada en LM para la comprensión de la consulta
- Aprovechando LLMS en producción: Mirando hacia atrás, en el futuro
- La amarga lección sobre los ingenieros en un mundo de chatgpt
- Poner la voz de los clientes en el proceso de desarrollo de software
- El viaje de Mercari integrando IA y búsqueda en Berlin Buzzwords 2023
- Mejora de la precisión de la recomendación del elemento utilizando filtrado colaborativo y motor de búsqueda vectorial
- Gestión de modelos para el lado del cliente ML con Firebase
- El viaje a la reducción de rango encendido por máquina
- ¿Necesitamos ingenieros en un mundo de chatgpt?
Meta
Publicaciones de blog
Meta AI Blog y trabajos de investigación
- Varios trabajos de investigación de IA/ML presentados por Meta están disponibles aquí
- Blog Meta AI
2024
- Aprovechando la IA para una respuesta eficiente de incidentes
- Mantener la capacidad de IA a gran escala en Meta
- Nuestro acelerador de entrenamiento e inferencia de meta de próxima generación
- PVF: una métrica novedosa para comprender la vulnerabilidad de los sistemas de IA contra los SDC en los parámetros del modelo
- Optimización de la estimación de ancho de banda RTC con aprendizaje automático
- Logarithm: un motor de registro para flujos de trabajo y servicios de capacitación de IA
- Construyendo la infraestructura Genai de Meta
- Mejora de la velocidad de iteración de aprendizaje automático con una compilación y embalaje de aplicación más rápida
- Lazy es el nuevo ayuno: cómo las importaciones perezosas y la ceniza aceleran el aprendizaje automático en Meta
- Cómo Meta está avanzando a Genai
- Cuadernos Jupyter sin servidor en Meta
- Construyendo silicio personalizado para el futuro de la IA
2023
- Presentación de Code Llama, un modelo de idioma grande de última generación para la codificación
- RELOJ: los ingenieros de Meta en la construcción de infraestructura de red para IA
- Cómo Meta está creando silicio personalizado para AI
- AI Depuración en Meta con Hawkeye
- Arcadia: un simulador de rendimiento del sistema AI de extremo a extremo
- MTIA V1: Acelerador de inferencia AI de primera generación de Meta
2022
- Ingestión de datos de escala para capacitación en aprendizaje automático en Meta
2021
- Datos totalmente fragmentados paralelos: entrenamiento de IA más rápido con menos GPU
- Asicmon: un sistema de observabilidad agnóstica de plataforma para aceleradores de IA
- Cómo el aprendizaje automático El aprendizaje de la máquina Algoritmo de clasificación de noticias de noticias de Facebook
Microsoft
Publicaciones de blog
2024
Morgan Stanley
Publicaciones de blog y sitios
2024
- Morgan Stanley Wealth Management despliega GPT-4 para organizar su vasta base de conocimiento
- Investigación de aprendizaje automático
Noción
Publicaciones de blog
2024
- La noción crea espacios de trabajo más inteligentes con Claude
- Ai es el nuevo plástico
- Conoce la nueva noción ai. Conozca lo que puede hacer por usted.
Nubank
Publicaciones de blog
2024
- AI en Nubank: Cómo uno de los bancos digitales más grandes del mundo usa inteligencia artificial
Escribuamiento
Publicaciones de blog
2024
- Scribd, Inc. aumenta el descubrimiento de contenido y el compromiso con Claude
Flojo
Publicaciones de blog
2024
- Empoderar a los ingenieros con IA
- Equilibrio de viejos trucos con nuevas hazañas: conversión a IA de enzima para reaccionar la biblioteca de pruebas en Slack
- Cómo construimos Slack Ai para ser seguro y privado
Construcción de slalom
Publicaciones de blog
2024
- El secreto del éxito en proyectos de ingeniería de datos a gran escala
- Ingeniería rápida de IA generativa: un acto de equilibrio
- Trapo para ingenieros de calidad
- Alimentar modelos de IA con datos flojos
- Manteniendo al humano en el bucle
2023
- Elevación de IA conversacional con datos dinámicos y API a través de la función de OpenAI llamadas
- Detrás de los modelos de idiomas grandes: incrustación de palabras
Grano de origen
Publicaciones de blog
2024
- SourceGraph mejora la inteligencia y la velocidad de su asistente de codificación con AI con Claude
Súper
Publicaciones de blog
2024
- Open Source and In-House: cómo Uber optimiza el entrenamiento LLM
- Genie: Copiloto de Gen Ai de Uber's Gen AI
- Querygpt - Lenguaje natural a SQL usando AI generativo
- Marketing personalizado a escala: sistema de recomendaciones fuera de la aplicación de Uber
- Datak9: auto-categorización de un exabyte de datos a nivel de campo a través de AI/ML
- De predictivo a generativo: cómo Miguel Ángel acelera el viaje de AI de Uber
- DragonCrawl: IA generativa para pruebas móviles de alta calidad
- Escala de infraestructura ai/ml en Uber
- Detener a los estafadores de Uber a través de desafíos de riesgo
- Puntajes de excelencia del modelo: un marco para mejorar la calidad de los sistemas de aprendizaje automático a escala
2023
- El poder transformador de la IA generativa en el desarrollo de software: lecciones del hackathon tecnológico de Uber
- Aplicaciones de recomendaciones innovadoras que utilizan dos integridades de torre en Uber
- Demanda y pronóstico de ETR en los aeropuertos
- Reloj de la entidad de riesgo: uso de la detección de anomalías para combatir el fraude
- Acelerar la optimización publicitaria: desatar el poder de la simulación de anuncios
- Uvitals: un sistema de detección de anomalías y alertas
2022
- Radar del proyecto: sistema inteligente de detección de fraude temprano con humanos en el bucle
- Deepeta: Cómo Uber predice los tiempos de llegada usando el aprendizaje profundo
- Verificación de documentos en tiempo real de Uber
- Cómo Uber optimiza el momento de las notificaciones push utilizando ML y la programación lineal
- ML Educación en Uber: diseño y resultados del programa
- ML Educación en Uber: marcos inspirados en principios de ingeniería
2021
- Aplicar el aprendizaje automático en auditoría interna con datos escasamente etiquetados
Walmart
Publicaciones de blog
2024
- Administración de acceso seguro de API a LLM en sistemas distribuidos con flujo de datos
- Creación de la aplicación web para interacciones de archivos usando RAG: una guía de desarrolladores
- Explorando el mundo de las bases de datos de vectores: una guía completa
- Usar predictivo y generación AI para mejorar la categorización de productos en Walmart
- Monitoreo continuo impulsado por la IA: el futuro de la gestión de riesgos de terceros
- Construye tu propio GPT (BYO-GPT)
- Titanes textuales: un modelo de lenguaje grande Odyssey
- Evaluación de las métricas de RAG con raga
- Desplegar trapos en producción - Parte 2
- Desplegar trapos en producción - Parte 1
- Extracción de atributos del producto de PDF utilizando PAE Framework
- Técnicas de aumento para la clasificación de texto desequilibrada
- Transformando la clasificación de texto con técnicas de búsqueda semántica - Faiss
2023
- Plataforma de aprendizaje automático en Walmart
- Capacitación del modelo de lenguaje grande (LLM) en sus datos
2022
- Guardar y recuperar modelos ML utilizando Pyspark en la plataforma en la nube
Wix
Publicaciones de blog
2024
- WIX Streamline el sitio web de creación de contenido con GPT.
- Pronóstico del mundo real con aprendizaje profundo: cómo lo hacemos en Wix
- Personalización de LLM para datos empresariales utilizando la adaptación de dominio: el viaje WIX
- AI para revolucionar el sistema de enrutamiento de atención al cliente en WIX
- Sagemaker Batch Transform Unleashed: mi viaje en Wix para lograr ML escalable
- Más allá de la generación de contenido: generación de diseño basada en IA para diseño gráfico
Otros recursos
Estudios de casos de proveedores
Siguiendo los recursos de proveedores de IA como OpenAI, Anthrope y Databricks proporcionan información valiosa sobre cómo las empresas están aprovechando la IA para resolver desafíos complejos e impulsar la innovación.
- Opadai
- Antrópico
- Databricks
Catálogo de diseño del sistema ML y LLM
- Diseño del sistema ML y LLM: 500 estudios de casos para aprender de
Colaboradores
Contribuir
¡Contribuciones bienvenidas! Lea las pautas de contribución primero.
Stargazers con el tiempo
Licencia
En la medida de lo posible según la ley, Unmesh Gundecha ha renunciado a todos los derechos de autor y derechos relacionados o vecinos sobre este trabajo.
Si decide usar esto en cualquier lugar, acredite @UPGUNDECHA en X. Además, si le gusta mi trabajo, consulte mis otros proyectos en GitHub.