QDRANT 라이브러리가있는 벡터-데이터베이스 및 문장 tansformers가 포함 된 내부
Conala 데이터 세트에서 벡터 데이터베이스 시뮬레이션.
데이터 세트
- Conala : 사용자 쿼리와 관련된 프로그램 스 니펫을 검색하는 코드/자연어 챌린지 데이터 세트.
프레임 워크
- 벡터 데이터베이스 : QDRANT 라이브러리를 사용한 메모리 인 벡터 데이터베이스.
- 임베딩 : 문장 변압기 (All-Minilm-L6-V2).
파일
- prepare_data.ipynb : 데이터를 보는 노트와 데이터 세트의 단순한 분석을 보는 노트.
- embeddings.ipynb : 문장 변환기를 사용하여 임베딩을 생성하는 전체 코드, QDRANT를 사용한 벡터-다타베이스를 작성한 다음 코사인 유사성을 기반으로 검색하는 전체 코드를 포함합니다.
레포가 도움이되면 a