Skip to content

TaynaP/peptides_signature

Repository files navigation

peptides_signature

Objectif

Ce programme a pour but de trouver les peptides uniques à une espèce (dans le cas où une protéine = une espèce), à un genre ou à une famille, à partir d'une liste de peptides. Dans le cas où aucun peptide unique ne serait trouvé, une combinaison de peptides unique est recherchée.

Description

Ce dossier contient deux dossiers : results (fichiers générés par le code, nos résultats) et fichier (fichiers utilisés, notamment le fichier csv contenant les peptides), suivi de notre code.

  • peptide est notre classe représentant un peptide
  • unique_peptides contient les fonctions utilisées pour chercher les peptides uniques dans les séquences.
  • genus et family contiennent les fonctions utilisées pour chercher les peptides uniques pour des familles ou genres
  • combinations contient les fonctions pour chercher les combinaisons uniques de peptides
  • Utils est un fichier où sont stockées les fonctions dont nous ne nous servons plus pour le moment
  • main contient uniquement la fonction main

Contraintes techniques

Lancement du code

Deux manières :

$ chmod u+x main.py

$ ./main.py [-h] [-p PEPTIDETHRESHOLD] [-c COMBINATIONTHRESHOLD] -i peptidesCSVFile -o resultsPath

Ou :

$ python3 main.py [-h] [-p PEPTIDETHRESHOLD] [-c COMBINATIONTHRESHOLD] -i peptidesCSVFile -o resultsPath

Paramètres

Obligatoires :

  • -i : le nom du fichier input contenant la liste des peptides (le fichier csv)
  • -o : le dossier (chemin) qui contiendra tous les fichiers résultats (ex : results/)

Facultatifs :

  • -h : message d'aide
  • -p : la taille minimale des peptides gardés (par défaut 1)
  • -c : le nombre maximal de peptides dans une combinaison (par défaut aucune limite)

Exemple de commande fonctionnelle :

$ python3 main.py -i files/COL1A1_trypsin.csv -o results/

Exemple de commande fonctionnelle avec options :

$ python3 main.py -i files/COL1A1_trypsin.csv -o results/ -p 5 -c 1

Syntaxe du fichier d'entrée

C'est un fichier CSV qui doit correspondre à une digestion in silico. Il peut être très facilement réalisable par RPG.

Syntaxe :

Famille_Genre_Nom_de_protéine,Numéro_peptide,Enzyme,Position_de_clivage,Taille_peptide,Masse_peptide,pI,Sequence_peptide

Si un peptide contient dans sa séquence un caractère qui ne correspond pas à un acide aminé, il ne sera pas pris en compte dans le traitement.

Pour obtenir ce fichier csv en utilisant RPG :

Il faut en entrée RPG un fichier fasta avec une en-tête pour chaque séquence rédigée de cette manière :

Famille_Genre_Nom_de_protéine

Exemple :

Bovidae_Bos_Bos_taurus_COL1A1_prot

Fichiers résultats

  • unique_peptides.csv : contient les peptides caractéristiques d'une séquence (qui n'apparaissent que dans une séquence)
  • unique_pep_genre.csv : contient les peptides caractéristiques d'une séquence vis-à-vis des séquences d'autres genres
  • unique_pep_family.csv : contient les peptides caractéristiques d'une séquence vis-à-vis des séquences d'autres familles
  • combinations.csv : contient les combinaisons uniques de peptides par protéine, genre et famille (des peptides qui n'apparaissent simultanément que dans une séquence, un genre ou une famille)
  • peptide_list.txt : contient la liste de tous les peptides associés aux peptides qui leurs sont identiques.

A noter que nous fournissons un fichier exemple "COL1A1_trypsin.csv" pour faire un test.

Docker

Il est possible de lancer le programme en passant par Docker, en créant une image (depuis le répertoire où se trouve le code):

docker build --tag [nom de l'image] .

Et en lançant un conteneur Docker en liant un répertoire sur la machine hôte (pour permettre de retrouver les fichiers résultats créés) :

$ docker run -v chemin/répertoire/sur/la/machine/hôte:/app/results [nom de l'image]

Auteurs

  • Léa Vandamme
  • Tayna Pellegri

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published