Biopal (V0.3) es un kit de herramientas bioinformática diseñado para procesar archivos de secuencia FASTA. La herramienta proporciona varias funcionalidades, como dividir los archivos FASTA, calcular los parámetros de proteínas, consultar información taxonómica de NCBI y mucho más. Utiliza la biblioteca tkinter para proporcionar una interfaz gráfica fácil de usar para una fácil entrada de archivos y selección de funciones.
File FastA dividido : divide un archivo FASTA en múltiples archivos más pequeños con un máximo de 99 secuencias por archivo. A veces se requiere para el procesamiento posterior.
Reano de encabezado : reanude los encabezados largos en los más cortos y estandarizados (por ejemplo, basado en el nombre del organismo del formato NCBI [organism=...] ) y genera un CSV que mapea los encabezados originales y nuevos. Proporciona un nuevo archivo FASTA con los nuevos encabezados cortos y las secuencias, y un archivo CSV con los nombres de encabezado "antiguos" y "nuevos/cortos" para un seguimiento adecuado de secuencias.
Calculadora Protparam : realiza cálculos a granel de varias propiedades de proteínas (por ejemplo, peso molecular, punto isoeléctrico, etc.) similar a la herramienta Protparam de Expasy y genera los resultados en un archivo CSV. Nota: Este programa ignora los caracteres "X" en todas las secuencias para realizar cálculos sin errores. Devuelve un archivo CSV con los resultados. Hasta ahora, esta característica todavía está codificada, y el usuario no puede cambiar la salida del programa.
Calculadora del índice de pliegue : consulte la herramienta de índice de pliegue de proteopedia para cada secuencia en el archivo FASTA y genera el índice de pliegue de cada secuencia a un archivo CSV.
Sagio de taxones : consultas información taxonómica (división, orden, clase, familia) para organismos en el archivo FASTA (requiere la presencia de [organism=...] en el encabezado) y escribe los resultados en un archivo CSV.
Microsintenic Retriever : a partir de un archivo FASTA que conatinan genes descargados de las colecciones de conjuntos de datos de NCBI, analiza los datos y encuentra datos GFF3 de los 20 kbp que rodean los genes de interés. Representa los datos en un archivo CSV legible, ideal para el análisis evolutivo.
Menú de ayuda : proporciona una descripción de las funcionalidades de la herramienta.
Salida : Cierra de forma segura la aplicación. El programa no contiene información de ruta/archivo.
Esta herramienta requiere que se instalen las siguientes bibliotecas de Python:
tkinter para la interfaz gráfica de usuario.biopython para analizar archivos FASTA y recuperar información taxonómica.requests y json para consultar bases de datos en línea como Proteopedia y NCBI.Puede instalar las dependencias necesarias utilizando:
pip install biopython requestsgit clone https://github.com/SilicoGoBrr/BioPal.git
cd BioPalpip install -r requirements.txtpython biopal.pySeleccione el archivo de entrada : haga clic en el botón "Seleccionar archivo de entrada" para elegir su archivo FASTA.
Elija una operación :
Los resultados se guardarán en el mismo directorio que el archivo de entrada, con los nombres de archivo apropiados basados en la operación realizada.
La función Taxa Sage utiliza la API Entrez de NCBI para recuperar datos taxonómicos. Para esto, debe especificar su dirección de correo electrónico, según lo requerido por la API Entrez de NCBI.
En el código, ubique la siguiente línea:
Entrez . email = "" # Add your email hereReemplácelo con su dirección de correo electrónico válida:
Entrez . email = "[email protected]"Este paso es necesario para que las solicitudes de la API de Entrez funcionen correctamente.
Limitación de la velocidad : la API NCBI Entrez puede imponer límites de velocidad. Para evitar ser limitado por la velocidad, la herramienta introduce un breve retraso entre las solicitudes de API cuando se usa la función Sage Sage.
Requisitos de formato FASTA : el archivo de entrada FASTA debe contener [organism=...] etiquetas para que la función de salvia de taxones funcione correctamente.
Este programa se proporciona "como está" sin garantías y garantías. Úselo bajo su propio riesgo. Algunas características pueden requerir una conexión a Internet activa.