Librairie gplots nécessaire pour faire tourner AnalyzeCovariates gatk

@team-r ou @team-software

Bonjour,

j'aimerai bien faire tourner la commande AnalyzeCovariates de gatk pour avoir une idée de l'effet de la recalibration de mes données mais je n'ai pas les droits pour installer la librairie gplots de r nécessaire à l'outil.
Serait-il possible de le faire ?
En vous remerciant par avance !!
Et bonnes fêtes de fin d'années à tous

Chloé

Bonjour Chloe,

En effet, GATK semble avoir quelques dépendances sur des librairies R: gsalib, ggplot2, reshape, gplots.
https://software.broadinstitute.org/gatk/documentation/article?id=11049

Je n'ai pas pu tester (faute de jeu de tests) mais en chargeant le module r/3.5.1 au préalable (avec les libraires installées), ça devrait le faire.

La libraire ggplot2 (v3.2.1) est déjà disponible via le module r/3.5.1
Les librairies reshape, gsalib et gplots ne sont pas installées.
Une demande est en cours: https://gitlab.com/ifb-elixirfr/cluster/conda-env/merge_requests/203.
Nous reviendrons vers vous dès que ce sera disponible.

En attendant, vous pouvez toujours installer les librairies dans votre home (mais elle sne seront disponible que pour vous).
Une fois le moule R chargé et lancé:

> install.packages("gsalib")
Warning in install.packages("gsalib") :
 'lib = "/shared/mfs/data/software/miniconda/envs/r-3.5.1/lib/R/library"' is not writable
Would you like to use a personal library instead? (yes/No/cancel) yes
Would you like to create a personal library ‘~/R/x86_64-conda_cos6-linux-gnu-library/3.5’ to install packages into?
[...]

Bonne journée

Bonjour Chloé,

Les librairies R en dépendance de GATK (gsalib v2.1, ggplot2 v3.2.1, reshape v0.8.8, gplots v3.0.1.1) ont été ajoutées à GATK. Il suffit donc de charger le module:

module load gatk4/4.0.10.0

Merci @gildaslecorguille

Bonne journée et bonnes fêtes également

Bonjour,

Même après avoir chargé le module gatk (4.0.10.0) et le module R (3.5.1), comme vous l'avez indiqué précédemment, il semblerait que la commande de gatk4 AnalyzeCovariates ne fonctionne toujours pas. La sortie d'erreur indique qu'aucun package nommé gplots n'est retrouvé :

[31 janvier 2020 14:27:56 CET] org.broadinstitute.hellbender.tools.walkers.bqsr.AnalyzeCovariates done. Elapsed time: 0.32 minutes.
Runtime.totalMemory()=2411724800
org.broadinstitute.hellbender.utils.R.RScriptExecutorException:
Rscript exited with 1
Command Line: Rscript -e tempLibDir = '/tmp/Rlib.4344349670956335364';source('/tmp/BQSR.5214145452326229473.R'); /tmp/AnalyzeCovariates4347549019114978754.csv /shared/projects/mbovis_diversity/new_arbo/5_vcf/tmp/Mbv-11436C1_recall3.table /shared/projects/mbovis_diversity/new_arbo/5_vcf/covariates/Mbv-11436C1_recall3.pdf
Stdout:
Stderr: Error in library(gplots) : aucun package nommé ‘gplots’ n'est trouvé
Calls: source -> withVisible -> eval -> eval -> library
Exécution arrêtée
[...]
Using GATK jar /shared/mfs/data/software/miniconda/envs/gatk4-4.0.10.0/share/gatk4-4.0.10.0-0/gatk-package-4.0.10.0-local.jar
Running:
    java -Dsamjdk.use_async_io_read_samtools=false -Dsamjdk.use_async_io_write_samtools=true -Dsamjdk.use_async_io_write_tribble=false -Dsamjdk.compression_level=2 -jar /shared/mfs/data/software/miniconda/envs/gatk4-4.0.10.0/share/gatk4-4.0.10.0-0/gatk-package-4.0.10.0-local.jar AnalyzeCovariates -before /shared/projects/mbovis_diversity/new_arbo/5_vcf/tmp/Mbv-11436C1_recall1.table -after /shared/projects/mbovis_diversity/new_arbo/5_vcf/tmp/Mbv-11436C1_recall2.table -bqsr /shared/projects/mbovis_diversity/new_arbo/5_vcf/tmp/Mbv-11436C1_recall3.table -plots /shared/projects/mbovis_diversity/new_arbo/5_vcf/covariates/Mbv-11436C1_recall3.pdf -verbosity ERROR
srun: error: cpu-node-79: task 0: Exited with exit code 3

Sauriez-vous pourquoi une telle erreur s'affiche ?

En vous remerciant par avance,
Aurélie

Bonjour Aurélie,

Je viens de constater que l'ordre de chargement des modules a son importance dans ce cas.

$ module load gatk4/4.0.10.0
$ module add r/3.5.1
$ R
> packageVersion("gplots")
Error in packageVersion("gplots") : package ‘gplots’ not found

$ module add r/3.5.1
$ module load gatk4/4.0.10.0
$ R
> packageVersion("gplots")
[1] ‘3.0.1.1’

Pouvez-vous vérifier l'ordre de chargement et tester en chargeant d'abord le module R puis par la suite GATK4 ?

Effectivement il semblerait, après test avec données, que l'ordre de chargement des modules avait son importance.
Je vous remercie pour votre réponse !

En vous souhaitant une bonne fin de journée,
Cordialement,
Aurélie

Super. Merci pour votre retour.

Bonne fin de journée et bon week-end.