CheatSheet Langchain Project 다운로드 - CheatSheet Langchain Project 소스 코드 다운로드

CheatSheet Langchain Project

AI 소스 코드

1.0.0

다운로드

AI 에이전트 프로젝트 : 자동 데이터 추출

이 프로젝트는 자동 데이터 추출 및 처리를 위해 AI 에이전트를 활용합니다. 이 시스템을 통해 사용자는 CSV 파일을 업로드하거나 Google 시트에 연결 한 다음 자연어 쿼리를 사용하여 데이터와 상호 작용할 수 있습니다. 에이전트는 쿼리를 기반으로 Python 코드를 생성하고, 데이터를 조작하기 위해 코드를 실행하고, 결과를 테이블, 플롯 또는 문자열 또는 파일에 유용한 데이터와 같은 다양한 형식으로 제공합니다.

내용 테이블

소개
특징
설치
용법
프로젝트 구조
오류 처리
라이센스

특징

데이터 소스 선택 : CSV 파일 업로드 또는 Google 시트 연결 중에서 선택하십시오.
자연어 쿼리 : 자연어 쿼리를 사용하여 데이터와 상호 작용합니다 (예 : "{회사}의 이메일 주소를 얻으십시오").
동적 코드 생성 : 시스템은 쿼리를 기반으로 파이썬 코드를 생성 한 다음 데이터를 조작하기 위해 실행됩니다.
출력 형식 : 결과는 쿼리에 따라 테이블, 플롯 (바/파이) 또는 문자열과 같은 다양한 형식으로 표시됩니다.
오류 처리 : 강력한 오류 처리는 유효하지 않은 파일 형식 또는 데이터 조작 오류와 같은 문제의 경우에도 원활한 사용자 상호 작용을 보장합니다.

배포 링크

Streamlit의 치트 시트 앱

설치

이 프로젝트를 실행하려면 Python 3.7 이상이 필요합니다. 이 프로젝트는 PIP를 통해 설치할 수있는 여러 타사 라이브러리를 사용합니다.

레포를 복제하십시오

    git clone https://github.com/UjjawalGusain/CheatSheet-Langchain-Project.git
    cd Langchain-Web-Agent

종속성 설치 : 가상 환경을 만들고 필요한 라이브러리를 설치하십시오.

    python3 -m venv venv
    source venv/bin/activate  # On Windows, use `venvScriptsactivate`
    pip install -r requirements.txt

Google Sheets API 설정 :
- Google Sheets API 문서의 단계에 따라 Google API 자격 증명을 얻으십시오.
- Credentials.json 파일을 다운로드하여 프로젝트의 루트 디렉토리에 배치하십시오.
응용 프로그램 실행 :

    streamlit run dashboard.py

이 명령을 실행하면 응용 프로그램이 시작되며 브라우저를 통해 응용 프로그램에 액세스 할 수 있습니다.

API

이 프로젝트는 여러 API를 사용하여 데이터 스크래핑 및 모델과의 상호 작용을 포함하여 다른 작업을 처리합니다. 통합 된 API는 다음과 같습니다.

Groq API :
- 모델 : llama-3.1-70b versatile
- 목적 : GROQ API는 응답을 생성하고 데이터 세트에서 작업을 실행하며 복잡한 쿼리를 처리하기 위해 큰 언어 모델과 상호 작용하는 데 사용됩니다. Model LLAMA-3.1-70B versatile은 효율적인 자연 언어 이해 및 생성에 활용되어 프로세스 쿼리 및 실행 가능한 결과를 생성하는 데 도움이됩니다.
- 용법:
  - API는 추출, 필터링 및 생성 요약과 같은 작업을 포함하여 데이터와 관련된 쿼리를 처리하도록 호출됩니다. 모델의 응답은 데이터 세트에 적용되는 작업을 형성하는 데 도움이됩니다.
  - 모델에 사용 된 프롬프트는 원하는 응답을 보장하고 실행 중 오류를 피하기 위해 특정 형식으로 구성됩니다.
스크레이퍼 API :
- 목적 : 스크레이퍼 API는 외부 소스에서 추가 데이터를 수집 하고이 데이터를 데이터 세트에 추가하는 데 사용됩니다.
- 용법:
  - 데이터 세트가 처리되고 필요한 작업이 수행되면 SCRAPER API는 외부 리소스에서 긁힌 추가 열을 통해 데이터를 풍부하게하는 데 도움이됩니다. 이것은 데이터 프레임에 "스크랩 된"열을 추가하여 수행됩니다.

용법

데이터 업로드 :

사이드 바에서 데이터 소스를 선택하십시오 : CSV를 업로드하거나 Google 시트를 연결하십시오.
- CSV를 업로드하는 경우 업로드 할 파일을 선택하십시오. Google 시트에 연결하는 경우 시트의 URL을 제공하십시오.
쿼리를 입력하십시오.
- 앱의 기본 영역에서 입력 상자에 자연어 쿼리를 입력하십시오. 예를 들어, "{company}의 이메일 주소를 얻으십시오".
결과보기 :
- 쿼리를 기반으로 AI 에이전트는 Python 코드를 생성하고 데이터에 적용하여 결과를 반환합니다. 결과는 테이블, 플롯 또는 문자열로 표시 될 수 있습니다.

발생하는 도전

프롬프트 형식 및 복잡성 : 중요한 도전은 모델로 전달 된 프롬프트가 시스템에 의해 올바르게 형식화되고 처리되도록하는 것이 었습니다. 모델은 쿼리의 구조와 복잡성에 따라 정확한 응답을 생성해야했습니다. 또한 정보를 추출하여 사용자에게, 특히 복잡한 쿼리를 통해 명확성과 일관성을 유지하는 것이 중요했습니다.
LLMS를 통한 보안 위험 관리 : LLMS (Lange Language Model) 활용 (LLMS)은 특히 데이터 개인 정보 및 민감한 정보 처리와 관련하여 잠재적 인 보안 위험이 도입되었습니다. 모델과 상호 작용하는 동안 기밀 또는 개인 데이터가 실수로 노출되지 않도록하는 것은 개발 프로세스의 중요한 측면이었습니다. 코드 및 처리 데이터를 생성하는 데 LLM을 사용하면서 이러한 위험을 최소화하기 위해 보호 조치를 구현해야했습니다.