(anteriormente descentralizada y colaborativa en blockchain)

| Manifestación | Simulación | Seguridad |
|---|---|---|
![]() | ![]() |
Compartir modelos actualizables (SUM) en blockchain es un marco para alojar y capacitar a los modelos de aprendizaje automático disponible públicamente. Idealmente, usar un modelo para obtener una predicción es gratuito. Agregar datos consiste en validación por tres pasos como se describe a continuación.

Los conceptos básicos del marco se pueden encontrar en nuestra publicación de blog. Se puede encontrar una demostración de un mecanismo de incentivos aquí. Se pueden encontrar más detalles en el documento inicial que describe el marco, aceptado para blockchain-2019, la Conferencia Internacional IEEE sobre Blockchain.
Este repositorio contiene:

Hay muchas opciones. Podemos restringir el marco a modelos simples: perceptrones, bayes ingenuos, centroide más cercano, etc. También podemos combinar el cálculo fuera de la cadena con el cálculo en la cadena de algunas maneras, como:
También podemos usar algoritmos que no requieren que se actualicen los parámetros de todos los modelos (por ejemplo, Perceptron). Esperamos inspirar más investigación de formas eficientes para actualizar modelos más complejos.
Algunas de esas propuestas no están en el verdadero espíritu de este sistema, que es compartir modelos completamente públicamente, pero para algunas aplicaciones pueden ser adecuadas. Al menos los datos se compartirían para que otros aún puedan usarlos para entrenar sus propios modelos.
Las tarifas en Ethereum son lo suficientemente bajas para modelos simples: unos pocos centavos a partir de julio de 2019. Los modelos simples de aprendizaje automático son buenos para muchas aplicaciones. Como se describió la respuesta anterior, hay formas de mantener las transacciones simples. Las tarifas están disminuyendo: Ethereum está cambiando a la prueba de estaca. Otras cadenas de bloques pueden tener tarifas más bajas o posiblemente sin tarifas.
Almacenar los parámetros del modelo fuera de la cadena, por ejemplo, con IPFS, es una opción, pero muchas de las soluciones populares no tienen reflejos robustos para garantizar que el modelo aún esté disponible si un nodo cae. Uno de los principales objetivos de este proyecto es compartir modelos y mejorar su disponibilidad, la forma más fácil de hacerlo ahora es tener el modelo almacenado y entrenado en un contrato inteligente.
¡Estamos felices de hacer mejoras! Si conoce una solución que sería más barata y más robusta que almacenar modelos en una cadena de bloques como Ethereum, ¡háganoslo saber presentando un problema!
Esto depende del mecanismo de incentivos (IM) elegido, pero esencialmente, perderá mucho dinero. Otros notarán que el modelo está funcionando mal o no funciona como se esperaba y luego dejarán de contribuir a él. Dependiendo de la IM, como en depósito, reembolso y toma: autoevaluación, otros que ya presentaron datos "buenos" con mucho gusto tomarán sus depósitos sin enviar más datos.
Además, las personas pueden corregir fácilmente sus datos automáticamente utilizando técnicas del aprendizaje no supervisado, como la agrupación. Luego pueden usar los datos fuera de línea para su propio modelo privado o incluso implementar un nuevo sistema de recolección utilizando ese modelo.
¡Genial! Este sistema funcionará como fuente de datos y modelos de calidad. Las personas contribuirán con datos para ayudar a mejorar los modelos de aprendizaje automático que usan en su vida diaria.
Las ganancias dependen del mecanismo de incentivos (IM). Sí, en depósito, reembolso y toma: autoevaluación, los contribuyentes no se beneficiarán y deberían poder reclamar sus propios depósitos. En el mecanismo basado en el mercado de predicción, los contribuyentes aún pueden ser recompensados por el proveedor original de la generosidad y el conjunto de pruebas.
Se pueden encontrar más detalles en nuestro documento inicial, IA descentralizada y colaborativa en blockchain, que describe el marco, aceptado para blockchain-2019, la conferencia internacional IEEE en blockchain.
Se puede encontrar un análisis de varios modelos de aprendizaje automático con el mecanismo de incentivos de autoevaluación en nuestro segundo artículo, análisis de modelos para la IA descentralizada y colaborativa en blockchain, que fue aceptada para la Conferencia Internacional de Blockchain de 2020.
Este proyecto da la bienvenida a las contribuciones y sugerencias. La mayoría de las contribuciones requieren que acepte un Acuerdo de Licencia de Contributor (CLA) que declare que tiene derecho y realmente hacernos los derechos para utilizar su contribución. Para más detalles, visite https://cla.microsoft.com.
Cuando envíe una solicitud de extracción, un bote CLA determinará automáticamente si necesita proporcionar un CLA y decorar el PR de manera apropiada (por ejemplo, etiqueta, comentario). Simplemente siga las instrucciones proporcionadas por el bot. Solo necesitará hacer esto una vez en todos los reposos usando nuestro CLA.
Este proyecto ha adoptado el Código de Conducta Open Open Microsoft. Para obtener más información, consulte el Código de Conducta Preguntas frecuentes o comuníquese con [email protected] con cualquier pregunta o comentario adicional.