hfp_bettercallsal_awsbatch: hfp_bettercallsal.xml annotate

author	galaxytrakr
date	Thu, 28 May 2026 20:31:42 +0000
parents
children

rev	line source
0 801b85b03a17 planemo upload galaxytrakr parents: diff changeset	1 <tool id="hfp_bettercallsal_awsbatch" name="bettercallsal" version="1.0.0+awsbatch">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	2 <description>An automated workflow to assign Salmonella serotype based on NCBI Pathogen Detection Project for Salmonella.</description>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	3 <requirements>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	4 <container type="docker">quay.io/galaxytrakr/mulled-v2-ebd88135862aa647eeae73d4d8e6ea8ec81245cd:v5.0</container>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	5 </requirements>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	6 <version_command>nextflow -version</version_command>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	7 <command detect_errors="exit_code"><![CDATA[
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	8 export MAMBA_ROOT_PREFIX="/server/galaxy/data/nextflow-micromamba-cache";
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	9 export NXF_HOME=\$(pwd)"/.nextflow-home";
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	10 input_path=\$(pwd)"/cpipes-input";
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	11 workdir_path=\$(pwd)"/work";
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	12 mkdir -p "\${input_path}" \|\| exit 1;
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	13 #import re
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	14 #if (str($input_read_type_cond.input_read_type) == "single_long" or str($input_read_type_cond.input_read_type) == "long_long"):
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	15 #for _, $unpaired in enumerate($input_read_type_cond.input):
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	16 #set read1 = str($unpaired.name)
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	17 #if not str($unpaired.name).endswith(('.fastq', '.fastq.gz')):
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	18 #set read1_ext = re.sub('fastqsanger', 'fastq', str($unpaired.ext))
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	19 #set read1 = str($unpaired.name) + str('.') + $read1_ext
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	20 #end if
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	21 ln -sf '$unpaired' "\${input_path}/$read1";
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	22 #end for
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	23 #elif (str($input_read_type_cond.input_read_type) == "paired"):
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	24 #for _, $pair in enumerate($input_read_type_cond.input_pair)
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	25 #set read_R1 = re.sub('\:forward', '_forward', str($pair.forward.name))
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	26 #set read_R2 = re.sub('\:reverse', '_reverse', str($pair.reverse.name))
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	27 #set read_R1_ext = re.sub('fastqsanger', 'fastq', str($pair.forward.ext))
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	28 #set read_R2_ext = re.sub('fastqsanger', 'fastq', str($pair.reverse.ext))
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	29 #if not str($pair.forward.name).endswith(('.fastq', '.fastq.gz')):
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	30 #set read_R1 = $read_R1 + str('.') + $read_R1_ext
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	31 #end if
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	32 #if not str($pair.reverse.name).endswith(('.fastq', '.fastq.gz')):
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	33 #set read_R2 = $read_R2 + str('.') + $read_R2_ext
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	34 #end if
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	35 ln -sf '$pair.forward' "\${input_path}/$read_R1";
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	36 ln -sf '$pair.reverse' "\${input_path}/$read_R2";
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	37 #end for
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	38 #end if
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	39 $__tool_directory__/1.0.0/cpipes
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	40 #if (str($input_read_type_cond.input_read_type) == "long_long"):
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	41 --pipeline bettercallsal_lr
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	42 #else
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	43 --pipeline bettercallsal
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	44 #end if
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	45 --input \${input_path}
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	46 --output cpipes-output
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	47 --fq_suffix '${input_read_type_cond.fq_suffix}'
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	48 #if (str($input_read_type_cond.input_read_type) == "long_long"):
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	49 --fq_single_end true
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	50 #elif (str($input_read_type_cond.input_read_type) == "single_long"):
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	51 --fq_single_end true
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	52 #elif (str($input_read_type_cond.input_read_type) == "paired"):
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	53 --fq_single_end false --fq2_suffix '${input_read_type_cond.fq2_suffix}'
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	54 #end if
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	55 --tuspy_n $tuspy_n
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	56 #if ($sourmash_cond.run == "true"):
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	57 --sfhpy_fcv $sourmash_cond.sfhpy_fcv
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	58 #end if
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	59 #if ($bcs_thresholds != 'relax' and str($input_read_type_cond.input_read_type) != "long_long"):
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	60 --kmaalign_ID $kma_id
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	61 #end if
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	62 #if ($sourmash_cond.run == "true"):
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	63 --sfhpy_fcv $sourmash_cond.sfhpy_fcv
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	64 #end if
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	65 --bcs_db_mode $bcs_db_mode
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	66 --bcs_thresholds $bcs_thresholds
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	67 --fq_filename_delim '${fq_filename_delim}'
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	68 --fq_filename_delim_idx $fq_filename_delim_idx
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	69 -work-dir "\${workdir_path}"
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	70 -profile stdkondagac;
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	71 #if (str($input_read_type_cond.input_read_type) == "long_long"):
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	72 mv './cpipes-output/bettercallsal_lr-multiqc/CPIPES-Report_multiqc_report.html' './multiqc_report.html' \|\| exit 1;
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	73 #else
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	74 mv './cpipes-output/bettercallsal-multiqc/CPIPES-Report_multiqc_report.html' './multiqc_report.html' \|\| exit 1;
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	75 #end if
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	76 rm -rf ./cpipes-output \|\| exit 1;
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	77 rm -rf ./work \|\| exit 1;
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	78 ]]></command>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	79 <inputs>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	80 <conditional name="input_read_type_cond">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	81 <param name="input_read_type" type="select" label="Select the read collection type">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	82 <option value="single_long" selected="true">Single-End short reads</option>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	83 <option value="paired">Paired-End short reads</option>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	84 <option value="long_long">Long reads</option>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	85 </param>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	86 <when value="single_long">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	87 <param name="input" type="data_collection" collection_type="list" format="fastq,fastq.gz"
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	88 label="Dataset list of unpaired short reads" />
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	89 <param name="fq_suffix" value=".fastq.gz" type="text" label="Suffix of the Single-End FASTQ"/>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	90 </when>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	91 <when value="long_long">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	92 <param name="input" type="data_collection" collection_type="list" format="fastq,fastq.gz"
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	93 label="Dataset list of long reads" />
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	94 <param name="fq_suffix" value=".fastq.gz" type="text" label="Suffix of the long read FASTQ"/>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	95 </when>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	96 <when value="paired">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	97 <param name="input_pair" type="data_collection" collection_type="list:paired" format="fastq,fastq.gz" label="List of Dataset pairs" />
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	98 <param name="fq_suffix" value="_R1_001.fastq.gz" type="text" label="Suffix of the R1 FASTQ"
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	99 help="For any data sets downloaded from NCBI into Galaxy, change this to _forward.fastq.gz suffix."/>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	100 <param name="fq2_suffix" value="_R2_001.fastq.gz" type="text" label="Suffix of the R2 FASTQ"
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	101 help="For any data sets downloaded from NCBI into Galaxy, change this to _reverse.fastq.gz suffix."/>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	102 </when>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	103 </conditional>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	104 <param name="bcs_db_mode" type="select" label="Select the database mode with bettercallsal"
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	105 help="Refer to `Database generation` section in our manuscript: https://doi.org/10.3389/fmicb.2023.1200983">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	106 <option value="snp" selected="true">per_snp_cluster</option>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	107 <option value="comp">per_computed_type</option>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	108 </param>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	109 <param name="tuspy_n" optional="true" value="10" type="integer" label="Enter the number of top unique serotypes to retain after initial MASH screen step"
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	110 help="The default value of 10 is suitable for almost all scenarios."/>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	111 <param name="bcs_thresholds" type="select" label="Enter the type of base quality thresholds to be set with bettercallsal"
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	112 help="The default value sets strictest thresholds that tends to filter out most of the false positive hits.">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	113 <option value="strict" selected="true">strict</option>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	114 <option value="relax">relax</option>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	115 </param>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	116 <param name="kma_id" optional="true" value="10.0" type="text" label="Enter the %ID threshold for KMA alignments of samples against genomes"
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	117 help="The default value of 10% works well for enrichment samples tested within FDA. The 'relax' preset for base quality thresholds automatically sets this value to 5%."/>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	118 <conditional name="sourmash_cond">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	119 <param name="run" type="select" label="Run sourmash"
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	120 help="Should sourmash be used for additional genome fraction filtering">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	121 <option value="true" selected="true">yes</option>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	122 <option value="false">no</option>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	123 </param>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	124 <when value="true">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	125 <param name="sfhpy_fcv" type="text" value="0.1" label="Enter the minimum coverage match with sourmash before a serotype hit is considered for further processing"
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	126 help="The default value is set at 10% coverage threshold."/>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	127 </when>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	128 <when value="false">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	129 <param name="sfhpy_fcv" type="select" label="Enter the minimum coverage match with sourmash before a serotype hit is considered for further processing"
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	130 help="THIS OPTION IS IGNORED IF SOURMASH TOOL IS NOT RUN.">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	131 <option value="NA" selected="true">N/A</option>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	132 </param>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	133 </when>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	134 </conditional>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	135 <param name="fq_filename_delim" type="text" value="_" label="File name delimitor by which samples are grouped together (--fq_filename_delim)"
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	136 help="This is the delimitor by which samples are grouped together to display in the final MultiQC report. For example, if your input data sets are mango_replicate1.fastq.gz, mango_replicate2.fastq.gz, orange_replicate1_maryland.fastq.gz, orange_replicate2_maryland.fastq.gz, then to create 2 samples mango and orange, the value for --fq_filename_delim would be _ (underscore) and the value for --fq_filename_delim_idx would be 1, since you want to group by the first word (i.e. mango or orange) after splitting the filename based on _ (underscore)."/>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	137 <param name="fq_filename_delim_idx" type="integer" value="1" label="File name delimitor index (--fq_filename_delim_idx)" />
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	138 <!-- <param name="runtime_profile" type="select" label="Run time profile">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	139 <option value="kondagac" selected="true">conda</option>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	140 <option value="cingularitygac">singularity</option>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	141 </param> -->
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	142 </inputs>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	143 <outputs>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	144 <data name="multiqc_report" format="html" label="bettercallsal: MultiQC Report on ${on_string}" from_work_dir="multiqc_report.html"/>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	145 </outputs>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	146 <tests>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	147 <!--Test 01: long reads-->
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	148 <test expect_num_outputs="2">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	149 <param name="input">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	150 <collection type="list">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	151 <element name="FAL11127.fastq.gz" value="FAL11127.fastq.gz" />
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	152 <element name="FAL11341.fastq.gz" value="FAL11341.fastq.gz" />
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	153 <element name="FAL11342.fastq.gz" value="FAL11342.fastq.gz" />
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	154 </collection>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	155 </param>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	156 <param name="fq_suffix" value=".fastq.gz"/>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	157 <output name="multiqc_report" file="multiqc_report.html" ftype="html" compare="sim_size"/>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	158 <!-- <output name="assembled_mags" file="FAL11127.assembly_filtered.contigs.fasta" ftype="fasta" compare="sim_size"/> -->
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	159 </test>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	160 </tests>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	161 <help><![CDATA[
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	162
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	163 .. class:: infomark
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	164
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	165 Purpose
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	166
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	167 bettercallsal is an automated workflow to assign Salmonella serotype based on NCBI Pathogen Detection Project for Salmonella.
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	168 It uses MASH to reduce the search space followed by additional genome filtering with sourmash. It then performs genome based
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	169 alignment with kma followed by count generation using salmon. This workflow can be used to analyze shotgun metagenomics
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	170 datasets, quasi-metagenomic datasets (enriched for Salmonella) and target enriched datasets (enriched with molecular baits specific for Salmonella)
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	171 and is especially useful in a case where a sample is of multi-serovar mixture.
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	172
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	173 It is written in Nextflow and is part of the modular data analysis pipelines (CFSAN PIPELINES or CPIPES for short) at CFSAN.
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	174
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	175
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	176 ----
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	177
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	178 .. class:: infomark
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	179
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	180 Testing and Validation
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	181
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	182 The CPIPES - bettercallsal Nextflow pipeline has been wrapped to make it work in Galaxy. It takes in either paired or unpaired short reads list as an input
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	183 and generates a MultiQC report in the final step. The pipeline has been tested on 2x300 bp MiSeq and 2x150 bp NextSeq simulated reads and has been shown to call multiple
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	184 Salmonella serotypes with up to ~95% accuracy. The pipeline has also been tested on metagenomics data sets from Peach and Papaya outbreaks as discussed in
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	185 our publication (https://www.frontiersin.org/articles/10.3389/fmicb.2023.1200983/full). All the original testing and validation was
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	186 done on the command line on the CFSAN Raven2 HPC Cluster.
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	187
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	188
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	189 ----
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	190
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	191 .. class:: infomark
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	192
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	193 Outputs
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	194
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	195 The main output file is a:
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	196
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	197 ::
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	198
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	199 - MultiQC Report: Contains a brief summary report including any serotyping and AMR result tables.
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	200 Please note that due to MultiQC customizations, the preview (eye icon) will not
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	201 work within Galaxy for the MultiQC report. Please download the file by clicking
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	202 on the floppy icon and view it in your browser on your local desktop/workstation.
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	203 You can export the tables and plots from the downloaded MultiQC report.
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	204
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	205 ]]></help>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	206 <citations>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	207 <citation type="bibtex">
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	208 @article{bettercallsal,
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	209 author = {Konganti, Kranti},
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	210 year = {2023},
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	211 month = {August},
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	212 title = {bettercallsal: better calling of Salmonella serotypes from enrichment cultures using shotgun metagenomic profiling and its application in an outbreak setting},
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	213 journal = {Frontiers in Microbiology},
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	214 doi = {10.3389/fmicb.2023.1200983},
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	215 url = {https://www.frontiersin.org/articles/10.3389/fmicb.2023.1200983/full}}
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	216 </citation>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	217 </citations>
801b85b03a17 planemo upload galaxytrakr parents: diff changeset	218 </tool>

0

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

1 <tool id="hfp_bettercallsal_awsbatch" name="bettercallsal" version="1.0.0+awsbatch">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

2 <description>An automated workflow to assign Salmonella serotype based on NCBI Pathogen Detection Project for Salmonella.</description>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

3 <requirements>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

4 <container type="docker">quay.io/galaxytrakr/mulled-v2-ebd88135862aa647eeae73d4d8e6ea8ec81245cd:v5.0</container>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

5 </requirements>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

6 <version_command>nextflow -version</version_command>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

7 <command detect_errors="exit_code"><![CDATA[

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

8 export MAMBA_ROOT_PREFIX="/server/galaxy/data/nextflow-micromamba-cache";

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

9 export NXF_HOME=\$(pwd)"/.nextflow-home";

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

10 input_path=\$(pwd)"/cpipes-input";

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

11 workdir_path=\$(pwd)"/work";

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

12 mkdir -p "\${input_path}" || exit 1;

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

13 #import re

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

14 #if (str($input_read_type_cond.input_read_type) == "single_long" or str($input_read_type_cond.input_read_type) == "long_long"):

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

15 #for _, $unpaired in enumerate($input_read_type_cond.input):

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

16 #set read1 = str($unpaired.name)

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

17 #if not str($unpaired.name).endswith(('.fastq', '.fastq.gz')):

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

18 #set read1_ext = re.sub('fastqsanger', 'fastq', str($unpaired.ext))

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

19 #set read1 = str($unpaired.name) + str('.') + $read1_ext

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

20 #end if

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

21 ln -sf '$unpaired' "\${input_path}/$read1";

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

22 #end for

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

23 #elif (str($input_read_type_cond.input_read_type) == "paired"):

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

24 #for _, $pair in enumerate($input_read_type_cond.input_pair)

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

25 #set read_R1 = re.sub('\:forward', '_forward', str($pair.forward.name))

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

26 #set read_R2 = re.sub('\:reverse', '_reverse', str($pair.reverse.name))

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

27 #set read_R1_ext = re.sub('fastqsanger', 'fastq', str($pair.forward.ext))

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

28 #set read_R2_ext = re.sub('fastqsanger', 'fastq', str($pair.reverse.ext))

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

29 #if not str($pair.forward.name).endswith(('.fastq', '.fastq.gz')):

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

30 #set read_R1 = $read_R1 + str('.') + $read_R1_ext

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

31 #end if

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

32 #if not str($pair.reverse.name).endswith(('.fastq', '.fastq.gz')):

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

33 #set read_R2 = $read_R2 + str('.') + $read_R2_ext

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

34 #end if

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

35 ln -sf '$pair.forward' "\${input_path}/$read_R1";

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

36 ln -sf '$pair.reverse' "\${input_path}/$read_R2";

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

37 #end for

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

38 #end if

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

39 $__tool_directory__/1.0.0/cpipes

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

40 #if (str($input_read_type_cond.input_read_type) == "long_long"):

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

41 --pipeline bettercallsal_lr

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

42 #else

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

43 --pipeline bettercallsal

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

44 #end if

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

45 --input \${input_path}

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

46 --output cpipes-output

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

47 --fq_suffix '${input_read_type_cond.fq_suffix}'

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

48 #if (str($input_read_type_cond.input_read_type) == "long_long"):

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

49 --fq_single_end true

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

50 #elif (str($input_read_type_cond.input_read_type) == "single_long"):

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

51 --fq_single_end true

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

52 #elif (str($input_read_type_cond.input_read_type) == "paired"):

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

53 --fq_single_end false --fq2_suffix '${input_read_type_cond.fq2_suffix}'

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

54 #end if

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

55 --tuspy_n $tuspy_n

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

56 #if ($sourmash_cond.run == "true"):

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

57 --sfhpy_fcv $sourmash_cond.sfhpy_fcv

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

58 #end if

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

59 #if ($bcs_thresholds != 'relax' and str($input_read_type_cond.input_read_type) != "long_long"):

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

60 --kmaalign_ID $kma_id

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

61 #end if

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

62 #if ($sourmash_cond.run == "true"):

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

63 --sfhpy_fcv $sourmash_cond.sfhpy_fcv

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

64 #end if

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

65 --bcs_db_mode $bcs_db_mode

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

66 --bcs_thresholds $bcs_thresholds

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

67 --fq_filename_delim '${fq_filename_delim}'

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

68 --fq_filename_delim_idx $fq_filename_delim_idx

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

69 -work-dir "\${workdir_path}"

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

70 -profile stdkondagac;

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

71 #if (str($input_read_type_cond.input_read_type) == "long_long"):

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

72 mv './cpipes-output/bettercallsal_lr-multiqc/CPIPES-Report_multiqc_report.html' './multiqc_report.html' || exit 1;

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

73 #else

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

74 mv './cpipes-output/bettercallsal-multiqc/CPIPES-Report_multiqc_report.html' './multiqc_report.html' || exit 1;

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

75 #end if

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

76 rm -rf ./cpipes-output || exit 1;

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

77 rm -rf ./work || exit 1;

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

78 ]]></command>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

79 <inputs>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

80 <conditional name="input_read_type_cond">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

81 <param name="input_read_type" type="select" label="Select the read collection type">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

82 <option value="single_long" selected="true">Single-End short reads</option>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

83 <option value="paired">Paired-End short reads</option>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

84 <option value="long_long">Long reads</option>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

85 </param>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

86 <when value="single_long">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

87 <param name="input" type="data_collection" collection_type="list" format="fastq,fastq.gz"

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

88 label="Dataset list of unpaired short reads" />

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

89 <param name="fq_suffix" value=".fastq.gz" type="text" label="Suffix of the Single-End FASTQ"/>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

90 </when>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

91 <when value="long_long">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

92 <param name="input" type="data_collection" collection_type="list" format="fastq,fastq.gz"

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

93 label="Dataset list of long reads" />

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

94 <param name="fq_suffix" value=".fastq.gz" type="text" label="Suffix of the long read FASTQ"/>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

95 </when>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

96 <when value="paired">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

97 <param name="input_pair" type="data_collection" collection_type="list:paired" format="fastq,fastq.gz" label="List of Dataset pairs" />

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

98 <param name="fq_suffix" value="_R1_001.fastq.gz" type="text" label="Suffix of the R1 FASTQ"

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

99 help="For any data sets downloaded from NCBI into Galaxy, change this to _forward.fastq.gz suffix."/>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

100 <param name="fq2_suffix" value="_R2_001.fastq.gz" type="text" label="Suffix of the R2 FASTQ"

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

101 help="For any data sets downloaded from NCBI into Galaxy, change this to _reverse.fastq.gz suffix."/>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

102 </when>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

103 </conditional>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

104 <param name="bcs_db_mode" type="select" label="Select the database mode with bettercallsal"

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

105 help="Refer to `Database generation` section in our manuscript: https://doi.org/10.3389/fmicb.2023.1200983">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

106 <option value="snp" selected="true">per_snp_cluster</option>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

107 <option value="comp">per_computed_type</option>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

108 </param>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

109 <param name="tuspy_n" optional="true" value="10" type="integer" label="Enter the number of top unique serotypes to retain after initial MASH screen step"

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

110 help="The default value of 10 is suitable for almost all scenarios."/>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

111 <param name="bcs_thresholds" type="select" label="Enter the type of base quality thresholds to be set with bettercallsal"

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

112 help="The default value sets strictest thresholds that tends to filter out most of the false positive hits.">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

113 <option value="strict" selected="true">strict</option>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

114 <option value="relax">relax</option>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

115 </param>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

116 <param name="kma_id" optional="true" value="10.0" type="text" label="Enter the %ID threshold for KMA alignments of samples against genomes"

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

117 help="The default value of 10% works well for enrichment samples tested within FDA. The 'relax' preset for base quality thresholds automatically sets this value to 5%."/>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

118 <conditional name="sourmash_cond">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

119 <param name="run" type="select" label="Run sourmash"

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

120 help="Should sourmash be used for additional genome fraction filtering">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

121 <option value="true" selected="true">yes</option>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

122 <option value="false">no</option>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

123 </param>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

124 <when value="true">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

125 <param name="sfhpy_fcv" type="text" value="0.1" label="Enter the minimum coverage match with sourmash before a serotype hit is considered for further processing"

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

126 help="The default value is set at 10% coverage threshold."/>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

127 </when>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

128 <when value="false">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

129 <param name="sfhpy_fcv" type="select" label="Enter the minimum coverage match with sourmash before a serotype hit is considered for further processing"

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

130 help="THIS OPTION IS IGNORED IF SOURMASH TOOL IS NOT RUN.">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

131 <option value="NA" selected="true">N/A</option>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

132 </param>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

133 </when>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

134 </conditional>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

135 <param name="fq_filename_delim" type="text" value="_" label="File name delimitor by which samples are grouped together (--fq_filename_delim)"

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

136 help="This is the delimitor by which samples are grouped together to display in the final MultiQC report. For example, if your input data sets are mango_replicate1.fastq.gz, mango_replicate2.fastq.gz, orange_replicate1_maryland.fastq.gz, orange_replicate2_maryland.fastq.gz, then to create 2 samples mango and orange, the value for --fq_filename_delim would be _ (underscore) and the value for --fq_filename_delim_idx would be 1, since you want to group by the first word (i.e. mango or orange) after splitting the filename based on _ (underscore)."/>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

137 <param name="fq_filename_delim_idx" type="integer" value="1" label="File name delimitor index (--fq_filename_delim_idx)" />

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

138 <!-- <param name="runtime_profile" type="select" label="Run time profile">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

139 <option value="kondagac" selected="true">conda</option>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

140 <option value="cingularitygac">singularity</option>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

141 </param> -->

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

142 </inputs>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

143 <outputs>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

144 <data name="multiqc_report" format="html" label="bettercallsal: MultiQC Report on ${on_string}" from_work_dir="multiqc_report.html"/>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

145 </outputs>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

146 <tests>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

147

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

148 <test expect_num_outputs="2">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

149 <param name="input">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

150 <collection type="list">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

151 <element name="FAL11127.fastq.gz" value="FAL11127.fastq.gz" />

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

152 <element name="FAL11341.fastq.gz" value="FAL11341.fastq.gz" />

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

153 <element name="FAL11342.fastq.gz" value="FAL11342.fastq.gz" />

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

154 </collection>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

155 </param>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

156 <param name="fq_suffix" value=".fastq.gz"/>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

157 <output name="multiqc_report" file="multiqc_report.html" ftype="html" compare="sim_size"/>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

158

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

159 </test>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

160 </tests>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

161 <help><![CDATA[

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

162

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

163 .. class:: infomark

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

164

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

165 **Purpose**

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

166

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

167 bettercallsal is an automated workflow to assign Salmonella serotype based on NCBI Pathogen Detection Project for Salmonella.

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

168 It uses MASH to reduce the search space followed by additional genome filtering with sourmash. It then performs genome based

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

169 alignment with kma followed by count generation using salmon. This workflow can be used to analyze shotgun metagenomics

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

170 datasets, quasi-metagenomic datasets (enriched for Salmonella) and target enriched datasets (enriched with molecular baits specific for Salmonella)

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

171 and is especially useful in a case where a sample is of multi-serovar mixture.

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

172

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

173 It is written in Nextflow and is part of the modular data analysis pipelines (CFSAN PIPELINES or CPIPES for short) at CFSAN.

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

174

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

175

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

176 ----

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

177

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

178 .. class:: infomark

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

179

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

180 **Testing and Validation**

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

181

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

182 The CPIPES - bettercallsal Nextflow pipeline has been wrapped to make it work in Galaxy. It takes in either paired or unpaired short reads list as an input

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

183 and generates a MultiQC report in the final step. The pipeline has been tested on 2x300 bp MiSeq and 2x150 bp NextSeq simulated reads and has been shown to call multiple

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

184 Salmonella serotypes with up to ~95% accuracy. The pipeline has also been tested on metagenomics data sets from Peach and Papaya outbreaks as discussed in

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

185 our publication (https://www.frontiersin.org/articles/10.3389/fmicb.2023.1200983/full). All the original testing and validation was

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

186 done on the command line on the CFSAN Raven2 HPC Cluster.

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

187

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

188

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

189 ----

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

190

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

191 .. class:: infomark

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

192

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

193 **Outputs**

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

194

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

195 The main output file is a:

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

196

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

197 ::

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

198

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

199 - MultiQC Report: Contains a brief summary report including any serotyping and AMR result tables.

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

200 Please note that due to MultiQC customizations, the preview (eye icon) will not

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

201 work within Galaxy for the MultiQC report. Please download the file by clicking

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

202 on the floppy icon and view it in your browser on your local desktop/workstation.

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

203 You can export the tables and plots from the downloaded MultiQC report.

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

204

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

205 ]]></help>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

206 <citations>

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

207 <citation type="bibtex">

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

208 @article{bettercallsal,

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

209 author = {Konganti, Kranti},

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

210 year = {2023},

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

211 month = {August},

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

212 title = {bettercallsal: better calling of Salmonella serotypes from enrichment cultures using shotgun metagenomic profiling and its application in an outbreak setting},

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

213 journal = {Frontiers in Microbiology},

801b85b03a17 planemo upload

galaxytrakr

parents:

diff changeset

214 doi = {10.3389/fmicb.2023.1200983},

801b85b03a17 planemo upload

galaxytrakr