Скачать SupaSeqs - скачать исходный код SupaSeqs

SupaSeqs

Другой исходный код

v0.0-beta.0?

Скачать

Supaseqs

В основном взрыв написан в PostgreSQL

SupaseQS - это инструмент, который можно использовать для управления базами данных последовательностей ДНК локально благодаря реализации PostgreSQL, предлагаемой Supabase .

Он использует PostgreSQL в качестве менеджера базы данных бэкэнд, векторизации на основе KMER и вектора, чтобы имитировать функциональные возможности взрыва.

1. Установка

Если вы работаете в среде Linux, вы можете просто загрузить/копировать setup.sh и запустить его:

 # Linux
wget https://raw.githubusercontent.com/AstraBert/SupaSeqs/main/scripts/setup.sh
bash setup.sh

1A. Предварительные запросы

Убедитесь, что в вашей среде есть:

git
Node v18 или следующее
npm и npx
python 3.10 или после процесса установки должны работать как на Windows, так и на Linux.

1B. Настройка среды

Прежде всего, клонировать этот репозиторий:

 # BOTH Windows and Linux
git clone https://github.com/AstraBert/SupaSeqs
cd SupaSeqs

Получите исполнительные файлы командной строки supabase :

 # BOTH Windows and Linux
npm install supabase

Создайте и запустите экземпляр Supabase:

 # BOTH Windows and Linux
npx supabase init
npx supabase start

Получите строку подключения из DB URL , который будет напечатан после этой команды:

 # BOTH Windows and Linux
npx supabase status

Создайте виртуальную среду, активируйте ее и установите необходимые зависимости:

 # Linux
python3 -m venv apienv
source apienv/bin/activate
python3 -m pip install -r requirements.txt

Или

 # Windows
python3 - m venv .apienv
.apienvScriptsactivate  # For Command Prompt
# or
.apienvActivate.ps1  # For PowerShell
python3 - m pip install - r .requirements.txt

1C. Запуск приложения

В виртуальной среде запустите:

 # BOTH Windows and Linux
cd scripts
python3 -m fastapi dev

Если есть проблемы с подключением к клиенту Supabase, обязательно замените строку подключения в строке 16 main.py на тот, который вы обнаружили, запускающую supabase status .

2. Как это работает

Приложение работает в качестве сервиса API, используя FastAPI. Соединение с супабазой обрабатывается с помощью реализации клиента sqlalchemy которая аналогична той, которая построена в библиотеке vecs .

Приложение принимает два типа запросов:

1- Post - загрузите последовательность или файл FASTA :

 # Single sequence
curl -X POST " http://127.0.0.1:8000/seqs/ " -H " accept: application/json " -H " Content-Type: application/json " -d " { " sequence " : " GGCAGAACCCAGGGCACCAGCACGCCGAAGGACCACCGCAGGCTGGCCAGCGCTCCACCCTCCCTGCACCACACCCTGCGAGCAAAAGGCAGCAGAAATGAAGAGCATTTACTTTGTGGCTGGATTGTTTGTAATGCTGGTACAAGGCAGCTGGCAACACCCACTTCAAGACACAGAGGAAAAACCCAGGTCTTTCTCAACTTCTCAAACAGACTTGCTTGATGATCCGGATCAGATGAATGAAGACAAGCGTCATTCACAGGGTACATTCACCAGTGACTACAGCAAGTTCCTCGACACCAGGCGTGCTCAAGACTTCTTGGATTGGCTGAAGAACACCAAGAGGAACAGGAATGAAAT " , " description " : " M57688.1 Octodon degus glucagon mRNA, complete cds " } "
# FASTA file
curl -X POST " http://127.0.0.1:8000/seqs/ " -H " accept: application/json " -H " Content-Type: application/json " -d " { " sequence " : " sequence.fasta " } "

Каждая последовательность векторизуется с 5-мерным представлением (массив 1024-DIM), которое затем загружается в таблицу sequences на супабазе вместе с описанием (если в случае отдельной последовательности, заголовки последовательностей для последовательностей в файле FASTA) и исходной последовательности.

2- GET - Поиск через базу данных последовательности

curl -X ' GET ' ' http://localhost:8000/seqs/AACTTCTCAAACAGACTTGCTTGATGATCCGGATCAGATGAATGAAGACAAGCGTCATTCACAGGGTACATTCACCAGTGACTACAGCAAGTTCCTCGACACCAGGCGTGCTCAAGACTTCTTGGATTGGCTGAAGAACACCAAGAGGAACAGGAATGAAAT?limit=100&threshold=75 ' -H ' accept: application/json '

Последовательность запроса становится вектором, и поиск базы данных ищет: возвращается ряд последовательностей (указанных с ограниченным ключом, максимум 1000) возвращается, если они соответствуют порогу сходства (указано в процентном значении с ключом по пороге ); Типичный ответ выглядит так:

{ "1" :{ "sequence" : " GGCAGAACCCAGGGCACCAGCACGCCGAAGGACCACCGCAGGCTGGCCAGCGCTCCACCCTCCCTGCACCACACCCTGCGAGCAAAAGGCAGCAGAAATGAAGAGCATTTACTTTGTGGCTGGATTGTTTGTAATGCTGGTACAAGGCAGCTGGCAACACCCACTTCAAGACACAGAGGAAAAACCCAGGTCTTTCTCAACTTCTCAAACAGACTTGCTTGATGATCCGGATCAGATGAATGAAGACAAGCGTCATTCACAGGGTACATTCACCAGTGACTACAGCAAGTTCCTCGACACCAGGCGTGCTCAAGACTTCTTGGATTGGCTGAAGAACACCAAGAGGAACAGGAATGAAAT " , "description" : " M57688.1 Octodon degus glucagon mRNA, complete cds " , "cos_dist" : 0.23987939711631145 }}

Это достигается благодаря функции, называемой match_page_sections и определено следующим образом:

 create or replace function public .match_page_sections (
  embedding vector( 1024 ),
  match_threshold float,
  match_count int
)
returns setof public . sequences
language sql
as $$
  select *
  from public . sequences
  where public . sequences .embedding <=> embedding < 1 - match_threshold
  order by public . sequences .embedding <=> embedding asc
  limit least(match_count, 1000 );
$$;

3. Вклад

Взносы более чем приветствуются! См. Руководство по взносу для получения дополнительной информации :)

4. финансирование

Если вы нашли этот проект полезным, пожалуйста, рассмотрите возможность финансировать его и заставить его расти: давайте поддерживать открытый источник вместе!?

5. Лицензия и права на использование

Этот проект представлен по лицензии MIT: он всегда будет открытым исходным кодом и бесплатно использовать.

Если вы используете этот проект, сообщите о авторе: Astra Clelia Bertelli

Расширять

Дополнительная информация

Версия v0.0-beta.0?
Тип Другой исходный код
Время обновления 2025-06-01
размер 38.54KB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

SupaSeqs

Supaseqs

В основном взрыв написан в PostgreSQL

1. Установка

1A. Предварительные запросы

1B. Настройка среды

1C. Запуск приложения

2. Как это работает

3. Вклад

4. финансирование

5. Лицензия и права на использование

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express