lushan 다운로드 lushan 소스 코드 다운로드

lushan

기타 소스코드

v2.0

다운로드

Lushan에 오신 것을 환영합니다

tao hui http://weibo.com/taohui3

영어 버전

디자인 개념

1. 루한은 무엇입니까?

Lushan은 Memcached 프로토콜을 사용하여 가벼운 키 값 데이터베이스였습니다. Lushan을 사용하면 Memcached와 같은 여러 기계에서 클러스터를 쉽게 구축 할 수 있습니다. Lushan 2.0은 또한 여러 공유 라이브러리를 장착 할 수있는 가벼운 응용 프로그램 프레임 워크로, 한 프로세스에서 동시에 데이터에 액세스하고 계산할 수 있으므로 대규모 데이터 정량 및 고성능 서비스를 쉽게 작성할 수 있습니다. 인터넷 추천, 광고 및 검색을위한 비즈니스 시나리오에 특히 적합합니다. Lushan은 Sina Weibo 추천 및 광고 사업에서 수년간 사용되었습니다.

2. Lushan의 특성

Memcached Protocol은 Memcached 프로토콜을 사용하여 널리 사용 된 Memcached의 다양한 언어 클라이언트를 활용할 수 있습니다.
여러 라이브러리. Lushan은 여러 라이브러리를 장착하여 모든 추가 데이터에 대해 서비스 세트를 재배치 할 필요가 없으며 다시 시작하지 않아도됩니다.
여러 컴퓨팅 모듈. Lushan은 여러 공유 라이브러리를 장착하여 데이터와 동일한 프로세스에 계산할 수 있으며 많은 양의 데이터에 의존하는 성능이 매우 높습니다.
통계적 상태 데이터 Lushan은 상세한 통계 상태 데이터를 가지고 있으며, 이는 운영 및 유지 보수에 매우 중요합니다.
매우 빠릅니다. Lushan은 IO 멀티플렉싱 커뮤니케이션 모델, 세심한 시간 초과 처리 및 가능한 한 적은 메모리 사본을 사용합니다.
hadoop. lushan lushanfileoutputformat.java는 hadoop에 직접 장착 할 수있는 라이브러리 형식을 사용할 수 있습니다. 또한 전송 프레임 워크를 제공하여 간단하고 엄격한 방식으로 온라인으로 데이터를 만들 수 있습니다.
Redis. Lushan은 LPROXY 모듈을 통해 Redis를 연결하여 Batch 업데이트 된 정적 데이터와 실시간 업데이트 된 동적 데이터를 결합하여 매우 강력한 기능으로 주요 값 스토리지 클러스터를 형성합니다.

3. 왜 루칸을 개발합니까?

2013 년경, 나는 "Misted Weibo"권장 사항을 개발하고있었습니다. 온라인 및 테스트 버전뿐만 아니라 다양한 알고리즘을 실험하기 위해 온라인으로 여러 데이터 저장소를 제공해야합니다. 이를 위해서는 여러 시스템을 배포해야합니다. 이 접근법은 너무 낮습니다. 그래서, 한 주말에 나는 Lushan을 개발하여 이런 것들에서 당신을 자유롭게 해줄 수 있습니다.

이것은 사실입니다. Lushan은 이후 Weibo 추천 및 광고 사업의 인프라가되었습니다. 이제 12 대의 기계로 각각 T의 온라인 쿼리 데이터를 제공하는 2 개의 클러스터가 각각 10 억 개 이상의 쿼리를 제공합니다.

Lushan의 첫 번째 버전 개발을 마쳤을 때 Lushan이 공유 라이브러리를 동시에 장착 할 수 있도록 항상 욕구가있었습니다. 그러나 나는 프레임 워크가 고유 한 위치를 가져야한다고 생각하기 때문에 오랫동안 내 마음을 구성하지 않았고, 다른 하나는 쉽게 변경된 부분이 아키텍처에서 안정적인 부분과 분리되어야한다는 것입니다. 그러나 2015 년에 Weibo 광고를 개발할 때 사용자의 관심 데이터, 관계형 데이터 및 기능 데이터는 Hadoop를 통해 쉽게 정렬되어 Lushan에 저장되었으며, 두 개의 모듈은 타겟팅 및 CTR 예측 기능을 구현할 수 있습니다. 그래서 나는 원래 아이디어를 포기하고 두 번째 버전을 구현하여 Lushan 기능을 더욱 강력하게 만들었습니다. 실제 애플리케이션에서는 Lushan을 키 값 데이터베이스로만 사용하거나 동시에 컴퓨팅을 제공하는 데이터 및 클러스터 만 제공하는 Lushan 클러스터를 배포 할 수 있습니다.

4. 빨리 시작하십시오

의존하다

Libevent 1.4 이상.
소프트웨어 프레임 워크 기능을 사용하려면 libmemcached-1.0 이상이 필요합니다.
redis에 연결하려면 lproxy를 사용해야하는 경우 클라이언트 Cliredis-0.13 이상의 Redis가 필요합니다.

컴파일 및 설치

makefile을 열고 libevent_home을 자신의 libevent 설치 경로로 변경하십시오.
멀리 만드십시오
conf/lushan.conf를 열고 설치 디렉토리에 따라 hdb_path, upload_path, hmod_path 및 log_path를 수정하십시오.
BIND IP가 필요하다면 Conf/Lushan.conf에서 BIND_ADDR을 설정할 수 있습니다. Lushan.conf 구성 "="숫자에는 쉘 스크립트로 직접 처리됩니다.
rsyncd.conf에 lushan_upload 모듈을 추가하면 경로는 위에서 설정 한 $ upload_path와 일치합니다.

데이터 액세스 예제

예제 디렉토리에 샘플 라이브러리가 제공되어 다음 단계에 따라 마운트합니다.

bin/lushan.sh> dev/null 2> & 1 &
rsync 예제/hdict_20150820131415 127.0.0.1::lushan_upload/1/
t
echo -n -e "1-123456 r n"| NC 127.0.0.1 9999

출력은 키 123456에 해당하는 값입니다.

각 단계 설명 :

첫 번째 단계는 Lushan 프로세스를 시작하는 것입니다. Lushan.sh는 Lushan 프로세스를 시작하고 3 초마다 $ upload_path 디렉토리를 확인해야합니다. $ upload_path/$ no directory에 hdcit_xxxx가있는 폴더가있는 경우 done.flg 파일이 포함됩니다. 그런 다음 $ hdb_path/$ no로 옮기고 $ hdict_xxxx를 마운트하기 위해 Lushan 프로세스에 명령을 보내십시오.
rsync hdict_xxxx는 $ upload_path/$ no로, $ no는이 데이터 세트가 Lushan에 장착 될 숫자입니다. RSYNC가 데이터를 다른 컴퓨터로 전달할 수있을뿐만 아니라 RSYNC가 성공적으로 전송되거나 실패하며 파일의 절반의 중간 상태가 없을 것이기 때문에 CP 대신 RSYNC를 사용하십시오.
위의 단계가 완료되면 라이브러리는 여전히 자동으로 장착되지 않습니다. lushan.sh는 hdict_xxxx가 전송되었는지 또는 그 파일의 일부만 전송되었는지 알지 못하기 때문입니다. 따라서 hdict_xxxx 폴더로 rsync done.flg를 rsync해야합니다. 이렇게하면 아래의 "클러스터를 빌드하는 방법"에서 언급했듯이 여러 Lushan 서버에서 온라인으로 데이터를 온라인으로 유지할 수 있습니다.
memcached 클라이언트를 사용하여 장착 한 라이브러리를 쿼리 할 수 있습니다. 그러나 더 쉬운 방법은 Memcached 프로토콜을 준수하는 명령을 보내는 것입니다. 위의 명성과 행운은 라이브러리 번호 1에서 Key 123456을 쿼리하려는 것을 의미합니다.

계산 모듈 예제

컴퓨팅 프레임 워크로 사용될 때 Lushan은 HTTP get의 단일 라인 "URL"프로토콜과 유사한 두 개의 프로토콜과 보내기 값 길이를 지정하는 HTTP 게시물과 유사한 프로토콜을 지원하며 이진 데이터 전송을 지원합니다. 모듈 디렉토리에 두 가지 예가 제공됩니다 : Lproxy 및 Lecho는 각각이 두 프로토콜을 보여줍니다.

LPROXY 예제, 요청 된 키의 경우 먼저 쿼리 redis를 먼저하고 Redis가있는 경우 직접 반환하고 Redis가있는 경우 로컬 장착 라이브러리를 쿼리하십시오. 간단한 경우,이 예제는 생산 환경에서도 더 복잡한 요구 사항이있는 경우이 코드를 수정하십시오.

아래 단계를 따르십시오.

텍스트 파일을 만들고 다음 두 줄을 입력하십시오. 첫 번째 탭은 키이며 다음은 다음과 같이 값입니다.
```
 168	hello lushan
 187	line 2
```
도구에서 lushan_line_maker를 사용하여 Lushan 파일 형식으로 변환하십시오.
기계에서 Redis를 시작하고, DBNO를 설정 한 다음 1 인 다음 레코드를 추가하고, 키는 168이고, 값은 "hello redis"입니다.
hproxy 디렉토리에서 Make를 실행하고 생성 된 hmodule.so 및 hmodule.conf를 hmod/15/1.0.0 디렉토리에 배치하고 hmodule.conf의 호스트 및 포트를 수정하여 IP 및 Redis 포트를 배포하십시오.
구현하다:
```
 echo -ne "hmod_open /mnt/lushan/hmod/15/1.0.0/ 15rn" | nc 127.0.0.1 9999
```
개방 된 것이 반환되면 성공적으로 켜집니다. 그렇지 않으면 libhiredis가 ld_library_path에 있는지 확인하십시오.

질문:

 echo -ne "get m15?k=1-168rn" | nc 127.0.0.1 9999
 VALUE m15?k=1-168 0 11
 hello redis
 END

 echo -ne "get m15?k=1-187rn" | nc 127.0.0.1 9999
 VALUE m15?k=1-187 0 6
 line 2
 END

그런 다음 예상대로 Redis가 존재하면 Redis 결과가 반환됩니다. 그렇지 않으면 Lushan 데이터가 쿼리됩니다.

모듈 닫기 :
```
 echo -ne "hmod_close 15rn" | nc 127.0.0.1 9999
```
모든 모듈에 전역 변수가없는 경우 HMOD_OPEN을 사용하여 이전 라이브러리를 직접 교체하여 온라인 서비스에 손실이 없을 수 있습니다.

레코의 예는 비슷합니다. 단순히 요청한 데이터는 매우 간단하며 자세히 설명되지 않습니다.

5. hdict 형식

HDICT는 Lushan이 장착 한 라이브러리 형식입니다. 그는 매우 간단합니다. HDICT_XXXX 디렉토리에는 DAT 및 IDX에 필요한 파일이 두 개 있습니다. 전자에는 데이터가 포함되어 있으며 후자는 DAT 파일에서 값 위치 오프셋의 키를 매핑하는 것입니다. 정의:

 typedef struct {
    uint64_t key;
    uint64_t pos;
} idx_t;

키는 라이브러리 번호가 포함되지 않은 64 비트 부호없는 긴 골격입니다. POS는 값의 길이와 DAT 파일의 오프셋으로 구성됩니다.

 pos = (length << 40) | offset;

IDX 파일은 IDX_T.key의 오름차순 순서로 배열되어야합니다. DAT 파일이 필요하지 않습니다. 이미 존재하는 DAT 파일에서 인덱스를 생성하거나 파일을 출력 할 때 동시에 인덱스를 생성 할 수 있습니다.

정렬 된 파일은 Map-Reduce 계산 모델에서 매우 일반적입니다. Hadoop에서 출력 파일 형식을 지정하여 HDICT 형식의 라이브러리를 생성 할 수 있습니다. 예를 들어 다음 명령은 다음과 같습니다.

 job.setOutputFormat(LushanFileOutputFormat.class);

6. 통계 상태 데이터

통계 상태 데이터를 얻기위한 세 가지 명령이 있습니다 : 통계, 정보 및 hmod_info. 전자는 글로벌 데이터를 출력하는 반면 후자는 각 라이브러리와 각 모듈에 대한 데이터를 출력합니다.

 echo -n -e "statsrn" | nc 127.0.0.1 9999

STAT pid 13810
STAT uptime 1435075686
STAT curr_connections 1411
STAT connection_structures 4061
STAT cmd_get 2099151223
STAT get_hits 3950240117
STAT get_misses 2443878402
STAT threads 16
STAT timeouts 117
STAT waiting_requests 0
STAT ialloc_failed 0
END

echo -n -e "inforn" | nc 127.0.0.1 9999

id                label state ref   num_qry  idx_num     open_time path
----------------------------------------------------------------
1   interest_CF_trends  OPEN  0   139922 18419392 150824-042654 /mnt/lushan/hdb/12/hdict_20150711204737
2   interest_CF_trends  OPEN  0   190508 26175141 150824-050246 /mnt/lushan/hdb/12/hdict_20150711204737

echo -ne "hmod_inforn" | nc 127.0.0.1 9999
id                label state ref   num_qry     open_time path
----------------------------------------------------------------
0                       OPEN  0  267130787 180419-174502 /mnt/lushan/hmod/0
5                       OPEN  0  336829974 180419-174503 /mnt/lushan/hmod/5

lushan.php를 사용하여 그래픽 통계 상태 페이지를 만들 수 있습니다.

7. 클러스터를 구축하는 방법?

MySQL에 대한 경험이 있다면 간단한 클러스터를 쉽게 구축 할 수 있습니다. 먼저 데이터를 그룹, 일반적으로 컴퓨터 번호의 배수로 나누고 싶습니다. 그런 다음 배포하려는 서비스 세트 수를 고려하십시오. 일반적으로 다른 IDC에 배포 된 두 세트의 세트. 그런 다음 그룹화 규칙을 따라 Memcached Client를 통해 데이터를 쿼리하십시오.

매우 간단하지만 Lushan은 여전히 데이터 전송의 세부 정보를 처리하는 데 도움이되는 간단한 프레임 워크를 제공합니다.

도서관이 HDICT 형식의 라이브러리가 생성되었는지 정기적으로 확인하십시오.
Hadoop에서 Lushan이있는 기계로 HDict 형식 라이브러리를 다운로드하거나 Lushan이 위치한 기계로 로컬에서 전송하십시오. 다음은 온라인으로 가기 전에 데이터가 합법적인지 확인할 수있는 플러그인입니다.
해당 번호의 각 Lushan 서비스 사본에 대한 RSync HDict 형식 파일. 모든 전송이 성공한 후, rsync done.flg는 각 Lushan 서비스 사본에 rsync를 사용하여 다른 서비스에서 동일한 데이터가 동시에 시작되도록합니다.

8. Lushan 비 최고 관행

도메인 이름을 구성하여 각 Lushan 시스템의 도메인 이름을 구성하면 도메인 이름을 교체 할 때만 데이터 전송 프로세스에서 도메인 이름을 구성 할 수 있습니다.
Lushan.php를 통해 데이터가 온라인 상태인지 모니터링 하면 라이브러리의 개방 시간 이이 라이브러리의 예상 업데이트 시간을 충족하는지 확인하십시오.
Lushan Service는 Key-Value 데이터베이스로 사용될 때 매우 안정적이며 일반적으로 문제없이 몇 년 동안 실행됩니다. 그러나 소프트웨어 프레임 워크로 사용되면 PHP를 통해 통계를 얻는 버그로 인해 다시 시작 될 수 있습니다. 다시 시작하면 알람이 호출됩니다.
lushan lushan hmodule을 재부팅 할 때 hmodule이 디렉토리에 존재하는지 여부를 결정하고 존재하면로드되지 않습니다. 이 파일을 새로 시작한 hmodule 디렉토리에 추가 할 수 있습니다.이 모듈에 버그가 있으면 다음에 다시 시작하여 다른 모듈의 정상적인 서비스를 보장합니다.

9. Memcached 프로토콜 지원을 복잡한 요청을 보내는 방법은 무엇입니까?

Memcached 프로토콜은 간단한 요청 만 지원하지만 비교적 복잡한 결과를 반환 할 수 있습니다. Set Class 명령은 복잡한 요청을 지원하지만 비교적 간단한 결과 만 지원합니다. Lushan 은이를 사용하면 HTTP의 Get 및 Post 프로토콜과 비슷합니다.

GET 요청의 "키"는 250 바이트 한도를 초과 할 수 있습니다. 보낼 때 설정 :
```
 memcached_behavior_set(memc, MEMCACHED_BEHAVIOR_VERIFY_KEY, 0);
```
이런 식으로 LibMemCached를 통해 전송하는 데 아무런 문제가 없습니다. 결과를 반환 할 때는 250 바이트 내에서 키를 반환해야합니다. 읽을 때 잘린 키에 따라 읽히고 잘린 키가 충돌하지 않습니다.
사용은 여러 줄의 요청을 보내는 데 도움이됩니다. 일반적으로 간단한 GET 요청으로 충분하지만 JSON과 유사한 요청을 보내려면 더 복잡한 프로토콜이 필요합니다. Lushan은 Gets 프로토콜을 다시 변형시키고 세트와 동일한 프로토콜로 수정했습니다. 클라이언트를 사용할 때 위의 설정을 눌러 키의 합법성을 확인한 다음 다음 형식으로 패킷을 보내십시오.
```
 gets key 0 0 value_lenrn
 valuern
```
리턴 결과에서 키를 가져 오십시오. 캡슐화는 lutil.h에서 만들어지고 hrequest_pack으로 전화하십시오.

10. Lushan 가능한 문제와 솔루션

STAT에는 더 많은 시간이 걸리거나 클라이언트에서 시간 초과 시간까지 더 많은 요청을 구성 할 수 있습니다.
특정 수의 업로드에서 전송되지 않은 많은 HDICT 파일이 있으며, 이는 일반적으로 전송 스크립트가 전송되기 전에 중단됩니다.

확장하다

추가 정보

버전 v2.0
유형 기타 소스코드
업데이트 시간 2025-03-11
크기 580.28KB
출처 Github

lushan

Lushan에 오신 것을 환영합니다

1. 루한은 무엇입니까?

2. Lushan의 특성

3. 왜 루칸을 개발합니까?

4. 빨리 시작하십시오

의존하다

컴파일 및 설치

데이터 액세스 예제

계산 모듈 예제

5. hdict 형식

6. 통계 상태 데이터

7. 클러스터를 구축하는 방법?

8. Lushan 비 최고 관행

9. Memcached 프로토콜 지원을 복잡한 요청을 보내는 방법은 무엇입니까?

10. Lushan 가능한 문제와 솔루션

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express