Skip to content

gvaleman/CONSENSO_D

Repository files navigation

CONSENSO_D

CONSENSO_D es un conjunto de scripts diseñado por el equipo de secuenciación y genómica del Instituto de Ciencias Sostenibles de Nicaragua con la finalidad de mapear, ensamblar y generar secuencias consenso de los 4 serotipos de Dengue y del virus de la Rabia a partir de archivos fastq de secuenciadores NANOPORE.

*Notar que CONSENSO_D está actualmente bajo desarollo activo. Esto significa que el formato de los datos, interfaz gráfica y funcionalidades estan evolucionando y estan propensas a cambiar con el tiempo para mejorar todo el sistema. Los procesos de generación de secuencias consenso se mantienen completamente funcionales y pueden ser utilizados con confianza.

CONSENSO_D usa multiples Scripts python y Bash que permiten realizar diferentes tareas:

  • Interfaz grafica intuitiva para manejar todos los procesos
  • Ensamblaje de Genomas del los 4 serotipos del dengue, Virus de la Rabia y el SARS CoV 2
  • Ensamblaje automático de los virus del dengue (sin especificar una referencia)
  • Permite realizar ensamblaje de plataformas Nanopore e Illumina
  • Realiza control de calidad de las secuencias mediante los paquetes fastQC y Multi QC
  • Realiza determinacion de linajes del virus del dengue bajo la nomenclatura Dengue-Lineages, implementando un modelo Random Forest de Aprendizaje automatico para
  • Clasificar los linajes (https://github.com/gvaleman/Viral-Branch)
  • Determinación de mutaciones para los serotipos del dengue

Dependencias:

INSTALANDO CONSENSO

CLONAR EL REPOSITORIO

En la terminal ejecutar el siguientes comando

cd
git clone https://github.com/gvaleman/CONSENSO_D.git

Instalar un ambiente conda de la siguiente manera

cd # sale a la carpeta home
cd CONSENSO_D # entrar a la carpeta de CONSENSO
conda env create -f environment.yml

Esperar mientras se realiza la instalación del entorno para iniciar a utilizar CONSENSO. El tiempo de instalación del ambiente dependerá de la velocidad y/o estabilidad del internet y de las caracteristicas de la computadora donde se esté instalando. Una vez instalado el ambiente, CONSENSO está listo para su uso.

USANDO CONSENSO

INSTRUCCIONES:

  • Activar el entorno CONSENSO_D
  • Acceder a la carpeta CONSENSO_D y entrar a la carpeta bin.
  • Abrir una terminal y ejecutar el Script CONSENSO.py. Esto se puede hacer de la siguiente manera abriendo una terminal
    cd # sale a la carpeta home
    cd CONSENSO_D # entrar a la carpeta de CONSENSO
    cd bin #entrar a la carpeta bin
    conda activate CONSENSO_D #activar el entorno antes de iniciar la aplicación
    python3 CONSENSO.py -- gui #Ejecutar la interfaz gráfica directamente
    
  • Esto abrira una interfaz gráfica de usuario.
  • Ensamblaje de genomas: Seleccionar "Ensamblaje de genomas a la Izquierda
  • En la pantalla principal seleccionar la tecnologia de secuenciación, serotipo o virus, esquema de primers (si aplica), y dar click en Ejecutar
  • El Ensamblaje de genomas se ejecutara, mostrando el progreso. al finalizar un archivo llamado "all_consensus.fasta" se guardara en el directorio indicado

Información adicional:

  • CONSENSO puede ensamblar los 4 serotipos de dengue seleccionado cada serotipo en el menú desplegable de "Seleccionar virus". También, al seleccionar "DENV_AUTO", el sistema podrá predecir automaticamente cual es el serotipo a ensamblar y generará la secuencia consenso eficientemente. En caso de que se halla utilizado una amplificación multiplex de los serotipos, esta caracteristica puede identificar co-infecciones y generar las secuencias consensos de los serotipos presentes en la muestra. Esta última caracterisca dependerá de la calidad de la secuenciación.

ACTUALIZAR CONSENSO

Si ya tienes COSNENSO, es recomendabla actualizarlo frecuentemente, ya que esta primera versión esta bajo desarollo. Para actualizarlo solo debes "jalar" los cambios desde github y actualizar el entorno conda a como se meustra a continuacion.

cd
cd CONSENSO_D
git pull
conda env update -f environment.yml --prune

---------------------------------

Acerca del script contarX

Al acceder al directorio CONSENSO_D/Scripts se encontran una serie de Scripts que pueden ejecutarse manualmente. Se recomienda no modificar ningun Script para no modificar el flujo del sistema.

contarX es un script que cuenta el número de gaps (X) en una o más secuencias consenso. Obtener el número de gaps es importante porque brinda una idea de la covertura de la secuencia de referencia obtenida con respecto a una secuencia completa de referencia. Esto brinda una idea de la calidad de la secuencia y de manera indirecta brinda nociones sobre la calidad de la secuenciación, calidad de la muestra, calidad de los primers y/o reactivos.

contarX toma cada una de la secuencias de nucleótidos y las trata como una cadena de texto, evaluando caracter por caracter. Todos los caracteres "X" los cuenta por cada secuencia y finalmente muestra en la terminal el nombre de la secuencia y el número de X

INSTRUCCIONES

  • Abrir una terminal, haciendo click sobre el icono de la terminal o con la combinacion de teclas CTRL+ALT+T
  • Escribir el nombre del script: ./contarX
  • Escribir la dirección del archivo fasta o arrastrarlo hacia la terminal.
  • Presionar la tecla enter

Ejemplo

./contarX '/home/ics2/CONSENSO_D/ALL_CONSENSUS.fasta'

Donde

./contarX: nombre del script

'/home/ics2/CONSENSO_D/ALL_CONSENSUS.fasta': dirección exacta del archivo fasta

---------------------------------

Acerca del script RENOMBRAR

RENOMBRAR es un script que permite renombrar una o más secuencias consensos de manera autómatica en un archivo multifasta. Se requeren dos elementos: 1- Una archivo fasta con las secuencias sin renombrar 2- Un archivo txt con el nombre antiguo y nuevo de las secuencias. Este archivo txt se puede crear a partor de una hoja de excel, copiando y pegando el contenido de la hoja de excel a un editor de texto. es importante procurar que no quede ninguna linea vacia al final del texto. A continuación se muestra un ejemplo de la estructura final del archivo txt

barcode01 nuevo_nombre_1
barcode02	nuevo_nombre_2
barcode03	nuevo_nombre_3
barcode04	nuevo_nombre_4

INSTRUCCIONES

  • Abrir una terminal, haciendo click sobre el icono de la terminal o con la combinacion de teclas CTRL+ALT+T
  • Escrinir el nombre del script: ./RENOMBRAR
  • Escribir la dirección del de texto con los viejos y nuevos nombres o arrastrarlo hacia la terminal.
  • seguido de un espacio, escribir la dirección del archivo fasta sin renombrar o arrastrarlo hacia la terminal.
  • Escribir el simbolo ">" y la ubicación exacta y el nombre donde es guardará el nuevo archivo fasta

Ejemplo

./RENOMBRAR '/home/ics2/mi_carpeta/nombres.txt'  '/home/ics2/mi_carpeta/viejos_nombres.fasta' > /home/ics2/mi_carpeta/nuevo.fasta'

donde

./RENOMBRAR: Nombre del script

'/home/ics2/mi_carpeta/nombres.txt': Ubicación exacta del archivo de texto que contiene los nombres antiguos y nuevos

'/home/ics2/mi_carpeta/viejos_nombres.fasta': Ubicación exacta del archivo fasta que contiene las secuencias con los viejos nombres

/home/ics2/mi_carpeta/nuevo.fasta': Ubicación excta y nommbre del archivo que contendrá los archivos fasta renombrados. En este caso, el archivo se guardará en la la carpeta home, ics2, mi_carpeta, con el nombre "nuevo.fasta". Es importante guardarlo siempre con la extención ".fasta"

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published