Skip to content

Feedback on API documentation #155

@saphia

Description

@saphia

Here are several interrogations/suggestions I had while reading the API description:

Main page:

  • description of cocoatree.io.export_fasta => "fasta" should be uppercased.
  • explain somewhere the abbreviations? MSA, SCA?
  • add the references to the example datasets

classes description:

http://tree-bioinfo-intra.timc.fr/projects/cocoa/modules/classes.html

  • cocoatree.msa.filter_sequences:
    http://tree-bioinfo-intra.timc.fr/projects/cocoa/modules/generated/cocoatree.msa.filter_sequences.html#cocoatree.msa.filter_sequences
    => La description n'est pas claire : "Filter (1) overly gapped positions; (2) overly gapped sequences.".
    Quel est le type du retour une liste d'identifiants de sequences ou une liste de sequences ?
    Pourquoi c'est un array qui est renvoyé ? Il contient quoi ?

  • cocoatree.msa.filter_ref_seq
    Je trouve cette description peu claire : "Remove sequences r with Sr < delta, where Sr is the fractional identity between r and a specified reference sequence."
    Que veut dire "r" ici ? C'est appliqué à toutes les séquences données en entrée n'est-ce pas ?
    Quel comportement quand le "refseq_id" n'est pas donné ? Il est dit qu'il est "computed", mais comment le choix est-il fait ?

  • cocoatree.msa.map_to_pdb

    • Un détail : cette fonction est décrite comme "Mapping of the unfiltered MSA positions on a PDB structure."
      Selon les paramètres passés, j'aurais dit que cela pourrait fonctionner également sur les MSA filtrés ? (même si l'intérêt est sans doute limité ?).
      Est-ce que la sequence du PDB "pdb_seq" n'est pas deja de base dans "sequences"? Est-ce que ça ne suffirait pas d'avoir le paramètre ref_seq_id?
      (peut-être à renommer pour cohérence "pdb_seq_id"? cf aussi plus bas)

    • Autre chose : "ref_seq_id: str,
      identifier of the sequence the positions are mapped onto. Should be included in seq_list."
      => que représente "seq_list" ici ? est-ce que cela fait référence à l'argument "sequences_id"?
      Est-ce qu'on ne pourrait pas appeler "ref_seq_id" "pdb_seq_id" pour garder la convention de nommage des autres parametres ?

  • cocoatree.msa.map_msa_positions
    Je ne comprends pas tout à fait ce que cela fait vus les paramètres...
    "n_loaded_posint,
    Number of positions in the original unfiltered MSA"
    => nom du paramètre et sa description : je trouve que ce n'est pas très clair, c'est bien le "number of positions" (ça semble indiquer une longueur, un nombre de positions), mais ce devrait pas être une liste des indices des positions ?
    Pour le coup la description du 2nd paramètre "remaining_pos" est plus claire. Mais je ne comprends pas que le type ne soit pas le même que l'autre paramètre ?

Metadata

Metadata

Assignees

No one assigned

    Labels

    documentationImprovements or additions to documentation

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions