Die Tumblr-Muttergesellschaft Automattic plant, Benutzerbeitragsdaten für das Training von KI-Modellen an OpenAI und Midjourney zu verkaufen, ein Schritt, der Bedenken hinsichtlich der Privatsphäre und Datensicherheit der Benutzer aufwirft. Dies ähnelt früheren Fällen von Kooperationen zwischen Unternehmen wie Reddit und Shutterstock und KI-Unternehmen, bei denen es jeweils um die kommerzielle Nutzung von Benutzerdaten ging. Automattic verspricht, den Benutzern Einstellungen zur Verfügung zu stellen, mit denen sie die Datenweitergabe ablehnen können. Es bestehen jedoch immer noch viele Unklarheiten über den Umfang der Datenerhebung und -verarbeitungsmethoden, insbesondere im Hinblick auf den Umgang mit versehentlich gesammelten nicht öffentlichen Beiträgen, was weiterer Klärung und Erklärung bedarf.
Die Tumblr-Muttergesellschaft Automattic führt Gespräche mit OpenAI und Midjourney, um Benutzerbeiträge für das Training von KI-Modellen zu verkaufen. Automattic bereitet die Veröffentlichung einer Einstellung vor, die es Benutzern ermöglicht, die Datenweitergabe an Dritte abzulehnen. Sie haben alle öffentlichen Beiträge auf Tumblr von 2014 bis 2023 gecrawlt. Obwohl die Fehler einige nicht öffentliche Beiträge umfassen, ist nicht klar, wie die Daten verarbeitet werden und welche Daten zum Trainieren des Modells verwendet werden. Zuvor unterzeichnete Reddit eine Vereinbarung mit Google, um jedes Jahr Benutzerdaten zum Trainieren des KI-Modells von Google zu verwenden. Shutterstock unterzeichnete eine Vereinbarung mit OpenAI, um seine Fotobibliothek zum Trainieren des Modells zu nutzen.Dieser Schritt unterstreicht einmal mehr die Realität, dass das Training großer Sprachmodelle auf riesigen Datenmengen beruht, und wirft auch weiterhin Bedenken hinsichtlich Datenschutz und Ethik auf. Automattic muss seine Datenverarbeitungsprozesse transparent erläutern und sicherstellen, dass Benutzer echte Wahlmöglichkeiten haben, um das Vertrauen der Benutzer und die nachhaltige Entwicklung der Plattform aufrechtzuerhalten. In Zukunft werden ähnliche Datenaustauschpraktiken einer strengeren Regulierung und einer umfassenderen öffentlichen Kontrolle unterliegen.