AlexsLemonade · wvauclain · Jul 2, 2019 · Jul 1, 2019 · Jul 2, 2019 · Jul 2, 2019
diff --git a/.gitignore b/.gitignore
@@ -30,12 +30,7 @@ workers/test_volume/*
 !workers/test_volume/raw/TEST/TRANSCRIPTOME_INDEX/aegilops_tauschii_short.gtf.gz
 !workers/test_volume/raw/TEST/NO_OP/test.txt
 
-# Trying to ignore most of a directory tree but not a specific subfolder is tricky:
-# https://stackoverflow.com/questions/5533050/gitignore-exclude-folder-but-include-specific-subfolder
-!workers/test_volume/salmon_tests
-workers/test_volume/salmon_tests/*
-!workers/test_volume/salmon_tests/SRP095529/
-!workers/test_volume/salmon_tests/ZEBRAFISH_INDEX
+workers/test_volume/salmon_tests/
 
 
 # Byte-compiled / optimized / DLL files
@@ -139,4 +134,4 @@ dr_env/
 # emacs backup files
 *~
 
-.vscode
+.vscode
diff --git a/workers/data_refinery_workers/processors/salmon.py b/workers/data_refinery_workers/processors/salmon.py
@@ -408,7 +408,7 @@ def _find_or_download_index(job_context: Dict) -> Dict:
     except Exception as e:
         error_template = "Failed to download or extract transcriptome index for organism {0}: {1}"
         error_message = error_template.format(str(job_context['organism']), str(e))
-        logger.error(error_message, processor_job=job_context["job_id"])
+        logger.exception(error_message, processor_job=job_context["job_id"])
         job_context["job"].failure_reason = error_message
         job_context["success"] = False
 

diff --git a/workers/data_refinery_workers/processors/test_salmon.py b/workers/data_refinery_workers/processors/test_salmon.py
@@ -268,13 +268,6 @@ def check_salmon_quant(self, job_context, sample_dir):
         job_context = salmon._determine_index_length(job_context)
         job_context = salmon._find_or_download_index(job_context)
 
-        # This is a brittle/hacky patch.
-        # However I am unsure why the double_reads reads are
-        # determined to be short but require a long index to be
-        # processed successfully.
-        if "test_experiment" in sample_dir:
-            job_context["index_directory"] = job_context["index_directory"].replace("SHORT", "LONG")
-
         job_context = salmon._run_salmon(job_context)
         job_context = salmon.get_tximport_inputs(job_context)
         job_context = salmon.tximport(job_context)
@@ -767,7 +760,7 @@ def run_tximport_at_progress_point(complete_accessions: List[str], incomplete_ac
     """
     # Create the experiment
     experiment_accession = 'SRP095529'
-    data_dir = '/home/user/data_store/salmon_tests/'
+    data_dir = '/home/user/data_store/'
     experiment_dir = data_dir + experiment_accession
     experiment = Experiment.objects.create(accession_code=experiment_accession)
 
@@ -781,12 +774,12 @@ def run_tximport_at_progress_point(complete_accessions: List[str], incomplete_ac
     organism_index.index_type = "TRANSCRIPTOME_SHORT"
     organism_index.organism = zebrafish
     organism_index.result = computational_result_short
-    organism_index.absolute_directory_path = "/home/user/data_store/salmon_tests/ZEBRAFISH_INDEX/SHORT"
+    organism_index.absolute_directory_path = "/home/user/data_store/ZEBRAFISH_INDEX/SHORT"
     organism_index.save()
 
     comp_file = ComputedFile()
     # This path will not be used because we already have the files extracted.
-    comp_file.absolute_file_path = "/home/user/data_store/salmon_tests/ZEBRAFISH_INDEX/SHORT/zebrafish_short.tar.gz"
+    comp_file.absolute_file_path = "/home/user/data_store/ZEBRAFISH_INDEX/SHORT/zebrafish_short.tar.gz"
     comp_file.result = computational_result_short
     comp_file.size_in_bytes=1337
     comp_file.sha1="ABC"

diff --git a/workers/run_tests.sh b/workers/run_tests.sh
@@ -61,12 +61,14 @@ fi
 test_data_repo="https://s3.amazonaws.com/data-refinery-test-assets"
 
 if [[ -z $tag || $tag == "salmon" ]]; then
-    # Download "salmon quant" test data
+    # Download "salmon quant" test data The `newer` file was to
+    # signify that we using updated data. However the data has been
+    # updated again so now we need to go back to checking to make sure
+    # that it's not there so we know we have even NEWER data.
+    if [[ ! -e $volume_directory/salmon_tests || -e $volume_directory/salmon_tests/newer ]]; then
+        # Remove the data that comes from S3 so anything old is blown away.
+        rm -rf $volume_directory/salmon_tests
 
-    # TODO: rename the test_data_new to test_data and remove check for
-    # the new file. These are here temporarily so other branches'
-    # tests don't break.
-    if [[ ! -e $volume_directory/salmon_tests || ! -e $volume_directory/salmon_tests/newer ]]; then
         echo "Downloading 'salmon quant' test data..."
         wget -q -O $volume_directory/salmon_tests.tar.gz $test_data_repo/salmon_tests_newer.tar.gz
         tar xzf $volume_directory/salmon_tests.tar.gz -C $volume_directory
@@ -461,9 +463,6 @@ for image in ${worker_images[*]}; do
         elif [[ $tag == "janitor" ]]; then
             ./prepare_image.sh -i smasher -s workers
             image_name=ccdlstaging/dr_smasher
-        elif [[ $tag == "salmon" ]]; then
-            # ignore salmon tests temporarily
-            continue
         else
             ./prepare_image.sh -i $image -s workers
             image_name=ccdlstaging/dr_$image

diff --git a/...29/quant_files/SRR5125621_output/quant.sf → ...29/quant_files/SRR5125621_output/quant.sf b/...29/quant_files/SRR5125621_output/quant.sf → ...29/quant_files/SRR5125621_output/quant.sf
diff --git a/...29/quant_files/SRR5125622_output/quant.sf → ...29/quant_files/SRR5125622_output/quant.sf b/...29/quant_files/SRR5125622_output/quant.sf → ...29/quant_files/SRR5125622_output/quant.sf
diff --git a/...29/quant_files/SRR5125623_output/quant.sf → ...29/quant_files/SRR5125623_output/quant.sf b/...29/quant_files/SRR5125623_output/quant.sf → ...29/quant_files/SRR5125623_output/quant.sf
diff --git a/...29/quant_files/SRR5125624_output/quant.sf → ...29/quant_files/SRR5125624_output/quant.sf b/...29/quant_files/SRR5125624_output/quant.sf → ...29/quant_files/SRR5125624_output/quant.sf
diff --git a/...29/quant_files/SRR5125625_output/quant.sf → ...29/quant_files/SRR5125625_output/quant.sf b/...29/quant_files/SRR5125625_output/quant.sf → ...29/quant_files/SRR5125625_output/quant.sf
diff --git a/...29/quant_files/SRR5125626_output/quant.sf → ...29/quant_files/SRR5125626_output/quant.sf b/...29/quant_files/SRR5125626_output/quant.sf → ...29/quant_files/SRR5125626_output/quant.sf
diff --git a/...29/quant_files/SRR5125627_output/quant.sf → ...29/quant_files/SRR5125627_output/quant.sf b/...29/quant_files/SRR5125627_output/quant.sf → ...29/quant_files/SRR5125627_output/quant.sf
diff --git a/...29/quant_files/SRR5125628_output/quant.sf → ...29/quant_files/SRR5125628_output/quant.sf b/...29/quant_files/SRR5125628_output/quant.sf → ...29/quant_files/SRR5125628_output/quant.sf
diff --git a/...29/quant_files/SRR5125629_output/quant.sf → ...29/quant_files/SRR5125629_output/quant.sf b/...29/quant_files/SRR5125629_output/quant.sf → ...29/quant_files/SRR5125629_output/quant.sf
diff --git a/...29/quant_files/SRR5125630_output/quant.sf → ...29/quant_files/SRR5125630_output/quant.sf b/...29/quant_files/SRR5125630_output/quant.sf → ...29/quant_files/SRR5125630_output/quant.sf
diff --git a/...29/quant_files/SRR5125631_output/quant.sf → ...29/quant_files/SRR5125631_output/quant.sf b/...29/quant_files/SRR5125631_output/quant.sf → ...29/quant_files/SRR5125631_output/quant.sf
diff --git a/...29/quant_files/SRR5125632_output/quant.sf → ...29/quant_files/SRR5125632_output/quant.sf b/...29/quant_files/SRR5125632_output/quant.sf → ...29/quant_files/SRR5125632_output/quant.sf
diff --git a/...29/quant_files/SRR5125633_output/quant.sf → ...29/quant_files/SRR5125633_output/quant.sf b/...29/quant_files/SRR5125633_output/quant.sf → ...29/quant_files/SRR5125633_output/quant.sf
diff --git a/...29/quant_files/SRR5125634_output/quant.sf → ...29/quant_files/SRR5125634_output/quant.sf b/...29/quant_files/SRR5125634_output/quant.sf → ...29/quant_files/SRR5125634_output/quant.sf
diff --git a/...29/quant_files/SRR5125635_output/quant.sf → ...29/quant_files/SRR5125635_output/quant.sf b/...29/quant_files/SRR5125635_output/quant.sf → ...29/quant_files/SRR5125635_output/quant.sf
diff --git a/...29/quant_files/SRR5125636_output/quant.sf → ...29/quant_files/SRR5125636_output/quant.sf b/...29/quant_files/SRR5125636_output/quant.sf → ...29/quant_files/SRR5125636_output/quant.sf
diff --git a/...29/quant_files/SRR5125637_output/quant.sf → ...29/quant_files/SRR5125637_output/quant.sf b/...29/quant_files/SRR5125637_output/quant.sf → ...29/quant_files/SRR5125637_output/quant.sf
diff --git a/...29/quant_files/SRR5125638_output/quant.sf → ...29/quant_files/SRR5125638_output/quant.sf b/...29/quant_files/SRR5125638_output/quant.sf → ...29/quant_files/SRR5125638_output/quant.sf
diff --git a/...29/quant_files/SRR5125639_output/quant.sf → ...29/quant_files/SRR5125639_output/quant.sf b/...29/quant_files/SRR5125639_output/quant.sf → ...29/quant_files/SRR5125639_output/quant.sf
diff --git a/...29/quant_files/SRR5125640_output/quant.sf → ...29/quant_files/SRR5125640_output/quant.sf b/...29/quant_files/SRR5125640_output/quant.sf → ...29/quant_files/SRR5125640_output/quant.sf
diff --git a/..._tests/SRP095529/result-SRR5125622.tar.gz → ...volume/SRP095529/result-SRR5125622.tar.gz b/..._tests/SRP095529/result-SRR5125622.tar.gz → ...volume/SRP095529/result-SRR5125622.tar.gz
diff --git a/...FISH_INDEX/SHORT/genes_to_transcripts.txt → ...FISH_INDEX/SHORT/genes_to_transcripts.txt b/...FISH_INDEX/SHORT/genes_to_transcripts.txt → ...FISH_INDEX/SHORT/genes_to_transcripts.txt
diff --git a/...ts/ZEBRAFISH_INDEX/SHORT/versionInfo.json → ...me/ZEBRAFISH_INDEX/SHORT/versionInfo.json b/...ts/ZEBRAFISH_INDEX/SHORT/versionInfo.json → ...me/ZEBRAFISH_INDEX/SHORT/versionInfo.json