Téléchargement semantic ai - Téléchargement du code source semantic ai

semantic ai

Autre code source

v0.0.6.1

Télécharger

Logo sémantique AI

Sémantique ai lib

Un cadre open source pour le système de récupération (RAG) utilise la recherche sémantique pour récupérer les résultats attendus et générer des réponses conversationnelles lisibles par l'homme à l'aide de LLM (modèle grand langage).

Documents de documentation de la bibliothèque de l'AI sémantique ici

Exigences

Python 3.10+ asyncio

Installation

 # Using pip
$ python -m pip install semantic-ai

# Manual install
$ python -m pip install .

Définir la variable d'environnement

Définissez les informations d'identification dans le fichier .env. Donnez uniquement les informations d'identification pour un connecteur One, un indexeur unique et une configuration de modèle LLM. D'autres champs mis comme vides

 # Default
FILE_DOWNLOAD_DIR_PATH= # default directory name 'download_file_dir'
EXTRACTED_DIR_PATH= # default directory name 'extracted_dir'

# Connector (SharePoint, S3, GCP Bucket, GDrive, Confluence etc.,)
CONNECTOR_TYPE= " connector_name " # sharepoint
SHAREPOINT_CLIENT_ID= " client_id "
SHAREPOINT_CLIENT_SECRET= " client_secret "
SHAREPOINT_TENANT_ID= " tenant_id "
SHAREPOINT_HOST_NAME= ' <tenant_name>.sharepoint.com '
SHAREPOINT_SCOPE= ' https://graph.microsoft.com/.default '
SHAREPOINT_SITE_ID= " site_id "
SHAREPOINT_DRIVE_ID= " drive_id "
SHAREPOINT_FOLDER_URL= " folder_url " # /My_folder/child_folder/

# Indexer
INDEXER_TYPE= " <vector_db_name> " # elasticsearch, qdrant, opensearch
ELASTICSEARCH_URL= " <elasticsearch_url> " # give valid url
ELASTICSEARCH_USER= " <elasticsearch_user> " # give valid user
ELASTICSEARCH_PASSWORD= " <elasticsearch_password> " # give valid password
ELASTICSEARCH_INDEX_NAME= " <index_name> "
ELASTICSEARCH_SSL_VERIFY= " <ssl_verify> " # True or False

# Qdrant
QDRANT_URL= " <qdrant_url> "
QDRANT_INDEX_NAME= " <index_name> "
QDRANT_API_KEY= " <apikey> "

# Opensearch
OPENSEARCH_URL= " <opensearch_url> "
OPENSEARCH_USER= " <opensearch_user> "
OPENSEARCH_PASSWORD= " <opensearch_password> "
OPENSEARCH_INDEX_NAME= " <index_name> "

# LLM
LLM_MODEL= " <llm_model> " # llama, openai
LLM_MODEL_NAME_OR_PATH= " " # model name
OPENAI_API_KEY= " <openai_api_key> " # if using openai

# SQL
SQLITE_SQL_PATH= " <database_path> " # sqlit db path

# MYSQL
MYSQL_HOST= " <host_name> " # localhost or Ip Address
MYSQL_USER= " <user_name> "
MYSQL_PASSWORD= " <password> "
MYSQL_DATABASE= " <database_name> "
MYSQL_PORT= " <port> " # default port is 3306

Méthode 1: Pour charger le fichier .env. Le fichier Env devrait avoir les informations d'identification

%load_ext dotenv
%dotenv
%dotenv relative/or/absolute/path/to/.env

(or)

dotenv -f .env run -- python

Méthode 2:

 from semantic_ai . config import Settings
settings = Settings ()

Non-structure

1. Importez le module

 import asyncio
import semantic_ai

2. Pour télécharger les fichiers à partir d'une source donnée, extraire le contenu des fichiers téléchargés et indexer les données extraites dans la base de données vectorielle donnée.

 await semantic_ai . download ()
await semantic_ai . extract ()
await semantic_ai . index ()

Une fois le téléchargement, l'extrait et l'index, nous pouvons générer la réponse à partir de DB vectoriel indexé. Ce code indiqué ci-dessous.

3. Pour générer la réponse à partir de DB vectoriel indexé à l'aide du modèle LLM de récupération.

 search_obj = await semantic_ai . search ()
query = ""
search = await search_obj . generate ( query )

Supposons que le travail fonctionne pendant longtemps, nous pouvons regarder le nombre de fichiers traités, le nombre de fichiers a échoué et ce nom de fichier stocké dans le fichier texte qui est traité et échoué dans le répertoire 'extrait_dir_path / méta'.

Exemple

Pour connecter la source et obtenir l'objet de connexion. Nous pouvons le voir dans le dossier Exemples. Exemple: connecteur SharePoint

 from semantic_ai . connectors import Sharepoint

CLIENT_ID = '<client_id>'  # sharepoint client id
CLIENT_SECRET = '<client_secret>'  # sharepoint client seceret
TENANT_ID = '<tenant_id>'  # sharepoint tenant id
SCOPE = 'https://graph.microsoft.com/.default'  # scope
HOST_NAME = "<tenant_name>.sharepoint.com"  # for example 'contoso.sharepoint.com'

# Sharepoint object creation
connection = Sharepoint (
    client_id = CLIENT_ID ,
    client_secret = CLIENT_SECRET ,
    tenant_id = TENANT_ID ,
    host_name = HOST_NAME ,
    scope = SCOPE
)

Structure

1. Importez le module

 import asyncio
import semantic_ai

2. La connexion de la base de données

Sqlite:

 from semantic_ai . connectors import Sqlite

file_path = < database_file_path >

sql = Sqlite ( sql_path = file_path )

Mysql:

 from semantic_ai . connectors import Mysql

sql = Mysql (
    host = < host_name > ,
    user = < user_name > ,
    password = < password > ,
    database = < database > ,
    port = < port_number >  # 3306 is default port
)

3. Pour générer la réponse à partir de DB à l'aide du modèle LLM de récupération.

 query = ""
search_obj = await semantic_ai . db_search ( query = query )

Exécuter dans le serveur

$ semantic_ai serve -f .env

INFO:     Loading environment from ' .env '
INFO:     Started server process [43973]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://127.0.0.1:8000 (Press CTRL+C to quit)

Ouvrez votre navigateur à http://127.0.0.1:8000/semantic-ai