이것은 Marginalia 검색의 소스 코드입니다.
이 프로젝트의 목표는 인터넷을위한 새롭고 대안적인 발견 방법을 개발하는 것입니다. 그것은 공공 서비스만큼 실험적인 워크숍입니다. 가장 중요한 목표는 인터넷의 비영리 측면을 더 높이기위한 것입니다.
부수적 인 것은 데이터 센터 및 엔터프라이즈 하드웨어 예산을 요구하지 않고이 작업을 수행하여 최소한의 운영 오버 헤드로 저렴한 하드웨어 에서이 작업을 실행할 수 있도록하는 것입니다.
장기 계획은 검색 엔진을 개선하여 보조금, 기부 및 상업용 API 라이센스를 통해 프로젝트에 자금을 지원할 수있는 충분한 공공 가치를 제공하는 것입니다 (비상업적 주식은 항상 무료).
이 시스템은 Marginalia 검색의 사본 또는 자신의 데이터 (크롤링 또는 측면로드)를위한 흰색 라벨 검색 엔진으로 실행할 수 있습니다. 현재 논리는 그다지 구성 가능하지 않으며, 많은 판단은 Marginalia 프로젝트의 목표를 기반으로하지만 추가 구성 가능성이 작업되고 있습니다!
다음은 검색 엔진의 자체 호스 가능한 베어 본 모드의 설정 및 작동 데모입니다.? https://www.youtube.com/watch?v=pnwmkenqq24
로컬 테스트 환경을 설정하려면 지침을 따르십시오. run/readme.md!
추가 문서화가 있습니까? https://docs.marginalia.nu/.
컴파일하기 전에 실행/setup.sh를 실행해야합니다. 이것은 코드를 실행하는 데 필요한 보충 모델 데이터를 다운로드합니다. 테스트를 실행하려면 이들도 필요합니다.
코드를 해킹하려면 확인 하시겠습니까? doc/ide-configuration.md.
생산과 같은 환경에는 많은 RAM과 이상적으로는 인덱스 용 Enterprise SSD와 크롤링 데이터를 저장하기위한 느린 하드 드라이브의 추가 테라 바이트가 필요합니다. 인덱스 크기를 제한하여 작은 하드웨어에서 실행하도록 만들 수 있습니다.
이 시스템은 확실히 32GB 기계로 실행되지만 아마도 더 작을 수는 있지만 그 크기는 디스크 캐싱에 빠르게 의존하기 때문에 잘 작동하지 않을 수 있습니다.
훨씬 작은 하드웨어 (및 인덱스 크기)로 로컬 개발자의 배포가 가능합니다.
? 코드/ - 소스 코드. 보다 ? 구조 및 아키텍처의 추가 분해를 위해 Code/ReadMe.md.
? 검색 엔진을 로컬로 실행하는 데 사용되는/ - 스크립트 및 파일
? 타사/ - 타사 코드
? DOC/ - 보충 문서
? 기고 .md- 기여 방법
? 라이센스 .md- 라이센스 약관
질문이나 피드백이 있으면 [email protected]에게 이메일을 보낼 수 있습니다.
대부분의 프로젝트는 AGPL 3.0과 함께 제공되며 예외가 있습니다. 일부 부품은 MIT에 따라 공동 라이센스가 있으며, 타사 코드에는 라이센스가 다를 수 있습니다. 적절한 readme.md / license.md를 참조하십시오.
이 프로젝트는 수정 된 캘린더 버전화를 사용합니다. 여기서 처음 두 쌍의 숫자는 최신 크롤링 작업과 일치하는 1 년 및 달이며 세 번째 숫자는 패치 번호입니다.
version
--
yy.mm.VV
-----
crawl
예를 들어, 23.03.02 2023 년 3 월 (2023 년 5 월에 출시)의 크롤링 데이터가있는 릴리스입니다. 23.02 릴리스의 두 번째 패치입니다.
같은 연도와 월을 가진 버전은 서로 호환되거나 동일한 데이터 세트를 사용할 수있는 업그레이드 경로를 제공하지만 다른 크롤링 세트에서 데이터 형식 변경이 도입 될 수 있으며 크롤러 데이터 가이 프로젝트의 주요 릴리스 사이클을 대략적으로 유형 수명을 가질 때 일반적으로 데이터를 처음부터 스크롤 할 것으로 예상됩니다. 약 2-3 개월 후에는 많은 죽은 링크로 눈에 띄게 부실합니다.
개발 목적으로 크롤링은 권장되지 않으며 샘플 데이터를 사용할 수 있습니다. 보다 ? 자세한 내용은 run/readme.md.
프로젝트에 기부하는 것을 고려하십시오.
이 프로젝트는 DG Communications Networks의 AEGIS, 보조금 계약 번호 101069594에 따라 유럽위원회의 차세대 인터넷 프로그램의 재정 지원을 통해 NLNET이 설립 한 펀드 인 NGI0 Entrust Fund를 통해 자금을 지원했습니다.