Ceci est le code source de la recherche de marginalia.
L'objectif du projet est de développer de nouvelles méthodes de découverte alternatives pour Internet. C'est un atelier expérimental autant qu'un service public, l'objectif global est d'élever les côtés les plus humains et non commerciaux d'Internet.
Un objectif latérale consiste à le faire sans exiger des centres de données et des budgets matériels d'entreprise, pour pouvoir exécuter cette opération sur du matériel abordable avec un minimum de frais généraux opérationnels.
Le plan à long terme consiste à affiner le moteur de recherche afin qu'il apporte suffisamment de valeur publique pour que le projet puisse être financé par des subventions, des dons et des licences API commerciales (la part de partage non commerciale est toujours gratuite).
Le système peut à la fois être exécuté en tant que copie de la recherche de marginalia, ou comme un moteur de recherche de label blanc pour vos propres données (rampée ou chargée latérale). À l'heure actuelle, la logique n'est pas très configurable, et beaucoup de jugements portés sont basés sur les objectifs du projet Marginalia, mais une configurabilité supplémentaire est en cours de travail!
Voici une démo de la configuration et du fonctionnement du mode Barebones auto-hébergé du moteur de recherche :? https://www.youtube.com/watch?v=pnwmkenqq24
Pour configurer un environnement de test local, suivez les instructions? Exécuter / readme.md!
D'autres documents sont disponibles? https://docs.marginalia.nu/.
Avant de compiler, il est nécessaire d'exécuter Run / setup.sh. Cela téléchargera des données de modèle supplémentaires nécessaires pour exécuter le code. Ceux-ci sont également nécessaires pour exécuter les tests.
Si vous souhaitez pirater le code, consultez? doc / ide-configuration.md.
Un environnement de type production nécessite beaucoup de RAM et idéalement des SSD d'entreprise pour l'index, ainsi que des téraoctets supplémentaires de disques durs plus lents pour stocker les données de rampe. Il peut être fait pour fonctionner sur un matériel plus petit en limitant la taille de l'index.
Le système fonctionnera certainement sur une machine de 32 Go, peut-être plus petit, mais à cette taille, il peut ne pas fonctionner très bien car il s'appuie sur la mise en cache du disque pour être rapide.
Le déploiement d'un développeur local est possible avec un matériel beaucoup plus petit (et une taille d'index).
? Code / - le code source. Voir ? Code / Readme.md pour une nouvelle ventilation de la structure et de l'architecture.
? Exécuter / - scripts et fichiers utilisés pour exécuter le moteur de recherche localement
? tiers / - code tiers
? DOC / - Documentation supplémentaire
? Contribution.md - comment contribuer
? Licence.md - Conditions de licence
Vous pouvez envoyer un courriel à [email protected] avec toute question ou commentaire.
La majeure partie du projet est disponible avec AGPL 3.0, à des exceptions. Certaines pièces sont co-licenciées en vertu du MIT, le code tiers peut avoir des licences différentes. Voir le Readme.md / Licence approprié.md.
Le projet utilise le versioning de calendrier modifié, où les deux premières paires de nombres sont un an et un mois coïncidant avec la dernière opération rampante, et le troisième numéro est un numéro de correctif.
version
--
yy.mm.VV
-----
crawl
Par exemple, 23.03.02 est une version avec des données d'exploration de mars 2023 (publiée en mai 2023). Il s'agit du deuxième patch pour la version 23.02.
Les versions de la même année et du même mois sont compatibles les unes avec les autres, ou offrent un chemin de mise à niveau où le même ensemble de données peut être utilisé, mais à travers différents ensembles de changements de format de données peut être introduit, et vous vous attendez généralement à recrraquer les données à partir de zéro car les données du compteur ont une durée de conservation approximativement aussi longtemps que les principaux cycles de version de ce projet. Après environ 2-3 mois, il devient sensiblement périmé avec de nombreux liens morts.
À des fins de développement, le rampage est découragé et des données d'échantillon sont disponibles. Voir ? Exécuter / readme.md pour plus d'informations.
Envisagez de faire un don au projet.
Ce projet a été financé par le Fonds d'attribution de NGI0, un fonds créé par NLNET avec un soutien financier du programme Internet de la prochaine génération de la Commission européenne, en vertu de l'égide des réseaux de communication DG, du contenu et de la technologie en vertu de l'accord de subvention n ° 101069594.