more namechange

alexandriai168 · alexandriai168 · commit c56e7734652a · 2025-04-22T13:44:20.000-07:00
diff --git a/build/build_dataset.py b/build/build_dataset.py
@@ -47,7 +47,7 @@ def process_docker(dataset,validate):
         'sarcpdo': ['sarcpdo'],
         'genes': ['genes'],
         'upload': ['upload'],
-        'crcPDO': ['crcPDO'], 
+        'crcpdo': ['crcpdo'], 
         'bladderpdo': ['bladderpdo']
     }
 
@@ -131,7 +131,7 @@ def process_omics(executor, dataset, should_continue):
         'sarcpdo': ['mutations', 'transcriptomics'],
         'pancpdo': ['transcriptomics'],
         'bladderpdo': ['copy_number', 'mutations', 'transcriptomics'],
-        'crcPDO':['copy_number', 'mutations', 'transcriptomics']
+        'crcpdo':['copy_number', 'mutations', 'transcriptomics']
     }
 
     expected_omics = dataset_omics_files.get(dataset, [])
diff --git a/build/crcPDO/01-samples-crcPDO.py b/build/crcPDO/01-samples-crcPDO.py
@@ -180,6 +180,6 @@ def generate_sample_file(sequencing_data_path:str = None, prev_samples_path:str
         else:
             print("Previous sample sheet {} detected. Running sample file generation and checking for duplicate IDs.".format(args.prevSamples))
             sample_sheet = generate_sample_file(sequencing_data_path = sequencing_download_path, prev_samples_path= args.prevSamples)
-        sample_sheet.to_csv("/tmp/crcPDO_samples.csv", index=False)
+        sample_sheet.to_csv("/tmp/crcpdo_samples.csv", index=False)
     
 
diff --git a/build/crcPDO/02-omics-crcPDO.py b/build/crcPDO/02-omics-crcPDO.py
@@ -82,7 +82,7 @@ def map_mutations(mutation_data, improve_id_data, entrez_data):
     mapped_mutation_data = mapped_mutation_data.rename(columns={'Entrez_Gene_Id':'entrez_id','Genome_Change':'mutation','Variant_Classification':'variant_classification'})
     mapped_mutation_data = mapped_mutation_data.drop(columns=['Hugo_Symbol','Tumor_Sample_Barcode','other_id'])
     mapped_mutation_data['source'] = "vandeWetering_2015"
-    mapped_mutation_data['study'] = "crcPDO"
+    mapped_mutation_data['study'] = "crcpdo"
     mapped_mutation_data = mapped_mutation_data.astype({'entrez_id':'int'})
 
     return(mapped_mutation_data)
@@ -136,7 +136,7 @@ def map_transcriptomics(transciptomics_data, improve_id_data, entrez_data):
     # clean up column names and data types
     mapped_transcriptomics_df = mapped_transcriptomics_df.drop(columns=['stable_id','patient','other_id'])
     mapped_transcriptomics_df['source'] = "vandeWetering_2015"
-    mapped_transcriptomics_df['study'] = "crcPDO"
+    mapped_transcriptomics_df['study'] = "crcpdo"
     mapped_transcriptomics_df = mapped_transcriptomics_df.astype({'entrez_id':'int','improve_sample_id':'int'})
     mapped_transcriptomics_df = mapped_transcriptomics_df[['entrez_id','transcriptomics','improve_sample_id','source','study']]
 
@@ -198,7 +198,7 @@ def map_copy_number(copy_number_data, improve_id_data, entrez_data):
     # clean up columns and data types
     improve_mapped_cn_df = improve_mapped_cn_df.drop(columns=['ID','score','other_id'])
     improve_mapped_cn_df['source'] = "vandeWetering_2015"
-    improve_mapped_cn_df['study'] = "crcPDO"
+    improve_mapped_cn_df['study'] = "crcpdo"
     improve_mapped_cn_df = improve_mapped_cn_df.rename(columns={'ENTREZID':'entrez_id'})
     improve_mapped_cn_df = improve_mapped_cn_df.astype({'entrez_id':'int','improve_sample_id':'int'})
     improve_mapped_cn_df = improve_mapped_cn_df[['entrez_id','copy_number','copy_call','study','source','improve_sample_id']]
@@ -241,8 +241,8 @@ def map_copy_number(copy_number_data, improve_id_data, entrez_data):
             exit()
         else:
             print("Starting transcriptomics data.")
-            transcriptomics_df = map_transcriptomics(transciptomics_data = "/tmp/GSE65253_col_tum_org_merge.csv.gz", improve_id_data = "/tmp/crcPDO_samples.csv", entrez_data = "/tmp/genes.csv")
-            transcriptomics_df.to_csv("/tmp/crcPDO_transcriptomics.csv", index=False)
+            transcriptomics_df = map_transcriptomics(transciptomics_data = "/tmp/GSE65253_col_tum_org_merge.csv.gz", improve_id_data = "/tmp/crcpdo_samples.csv", entrez_data = "/tmp/genes.csv")
+            transcriptomics_df.to_csv("/tmp/crcpdo_transcriptomics.csv", index=False)
     
     if args.mutations:
         if args.genes is None or args.genes=='':
@@ -253,8 +253,8 @@ def map_copy_number(copy_number_data, improve_id_data, entrez_data):
             exit()
         else:
             print("Starting mutations data.")
-            mutation_df = map_mutations(mutation_data = "/tmp/mutation_data.csv", improve_id_data = "/tmp/crcPDO_samples.csv", entrez_data = "/tmp/genes.csv")
-            mutation_df.to_csv("/tmp/crcPDO_mutations.csv", index=False)
+            mutation_df = map_mutations(mutation_data = "/tmp/mutation_data.csv", improve_id_data = "/tmp/crcpdo_samples.csv", entrez_data = "/tmp/genes.csv")
+            mutation_df.to_csv("/tmp/crcpdo_mutations.csv", index=False)
     
     if args.copy_number:
         if args.genes is None or args.genes=='':
@@ -265,6 +265,6 @@ def map_copy_number(copy_number_data, improve_id_data, entrez_data):
             exit()
         else:
             print("Starting copy number data.")
-            mutation_df = map_copy_number(copy_number_data = "/tmp/copy_num_data.csv", improve_id_data = "/tmp/crcPDO_samples.csv", entrez_data = "/tmp/genes.csv")
-            mutation_df.to_csv("/tmp/crcPDO_copy_number.csv", index=False)
+            mutation_df = map_copy_number(copy_number_data = "/tmp/copy_num_data.csv", improve_id_data = "/tmp/crcpdo_samples.csv", entrez_data = "/tmp/genes.csv")
+            mutation_df.to_csv("/tmp/crcpdo_copy_number.csv", index=False)
     
diff --git a/build/crcPDO/03-drug-crcPDO.py b/build/crcPDO/03-drug-crcPDO.py
@@ -43,18 +43,18 @@ def download_synapse_data(synID:str, save_path:str = None, synToken:str = None):
 
 
 ### create drug csv
-def create_crcPDO_drug_data(fitted_drug_data_path:str, prevDrugFilepath:str, output_drug_data_path:str):
+def create_crcpdo_drug_data(fitted_drug_data_path:str, prevDrugFilepath:str, output_drug_data_path:str):
     # import fitted drug data and get drug names from DRUG_NAME column
     fitted_drug_df = pd.read_csv(fitted_drug_data_path)
-    crcPDO_drugs_df = pd.DataFrame({"DRUG_NAME":fitted_drug_df['DRUG_NAME'].unique()})
+    crcpdo_drugs_df = pd.DataFrame({"DRUG_NAME":fitted_drug_df['DRUG_NAME'].unique()})
     # if there is a prev drug file, check for new drugs
     if prevDrugFilepath != None and prevDrugFilepath != "":
         prev_drug_df = pd.read_csv(prevDrugFilepath)
-        # get drugs that are only in the crcPDO_drugs_df (aka new drugs only)
-        new_drugs_df = crcPDO_drugs_df[~crcPDO_drugs_df.chem_name.isin(prev_drug_df.chem_name)]
+        # get drugs that are only in the crcpdo_drugs_df (aka new drugs only)
+        new_drugs_df = crcpdo_drugs_df[~crcpdo_drugs_df.chem_name.isin(prev_drug_df.chem_name)]
     else:
         # if there's no prev drugs, then all drugs are new
-        new_drugs_df = crcPDO_drugs_df
+        new_drugs_df = crcpdo_drugs_df
     # get new drug names
     new_drug_names = new_drugs_df['DRUG_NAME'].unique()
     # call function that gets info for these drugs
@@ -89,8 +89,8 @@ def create_crcPDO_drug_data(fitted_drug_data_path:str, prevDrugFilepath:str, out
     if args.Drug:
         if args.PrevDrugs is None or args.PrevDrugs=='':
             print("No previous drugs file provided.  Starting improve_drug_id from SMI_1. Running drug file generation")
-            create_crcPDO_drug_data(fitted_drug_data_path = "/tmp/fitted_data_GDSC_Org_restricted_11Mar25.csv", output_drug_data_path = "/tmp/crcPDO_drugs.tsv", prevDrugFilepath = "")
+            create_crcpdo_drug_data(fitted_drug_data_path = "/tmp/fitted_data_GDSC_Org_restricted_11Mar25.csv", output_drug_data_path = "/tmp/crcpdo_drugs.tsv", prevDrugFilepath = "")
         else:
             print("Previous drugs file {} detected. Running drugs file generation and checking for duplicate IDs.".format(args.PrevDrugs))
-            create_crcPDO_drug_data(fitted_drug_data_path = "/tmp/fitted_data_GDSC_Org_restricted_11Mar25.csv", prevDrugFilepath = args.PrevDrugs, output_drug_data_path = "/tmp/crcPDO_drugs.tsv")
+            create_crcpdo_drug_data(fitted_drug_data_path = "/tmp/fitted_data_GDSC_Org_restricted_11Mar25.csv", prevDrugFilepath = args.PrevDrugs, output_drug_data_path = "/tmp/crcpdo_drugs.tsv")
 
diff --git a/build/crcPDO/04-experiments-crcPDO.py b/build/crcPDO/04-experiments-crcPDO.py
@@ -109,6 +109,6 @@ def create_experiments_data(experiment_data_path:str, samples_data_path:str, dru
         else:
             print("Generating experiments data.")
             experiments_df = create_experiments_data(experiment_data_path = "/tmp/raw_data_GDSC_Org_restricted_11Mar25_plus_viabilities.csv", samples_data_path = args.Samples, drugs_data_path = args.Drugs)
-            output_path = "/tmp/crcPDO_experiments_for_curve_fitting.tsv"
+            output_path = "/tmp/crcpdo_experiments_for_curve_fitting.tsv"
             print("Experiments data sucessfully generated.  Saving tsv to {}".format(output_path))
             experiments_df.to_csv(output_path, sep='\t')
diff --git a/build/crcPDO/build_drugs.sh b/build/crcPDO/build_drugs.sh
@@ -5,8 +5,8 @@ echo "the variable is $1"
 trap 'echo "Error on or near line $LINENO while executing: $BASH_COMMAND"; exit 1' ERR
 
 # running the drug python script
-echo "Running 03-drug-crcPDO.py with token and PrevDrugs $1."
-python3 03-drug-crcPDO.py --Download --Drug --Token $SYNAPSE_AUTH_TOKEN --PrevDrugs $1
+echo "Running 03-drug-crcpdo.py with token and PrevDrugs $1."
+python3 03-drug-crcpdo.py --Download --Drug --Token $SYNAPSE_AUTH_TOKEN --PrevDrugs $1
 
 # running the drug descriptor python script
-python3 build_drug_desc.py --drugtable /tmp/crcPDO_drugs.tsv --desctable /tmp/crcPDO_drug_descriptors.csv.gz
+python3 build_drug_desc.py --drugtable /tmp/crcpdo_drugs.tsv --desctable /tmp/crcpdo_drug_descriptors.csv.gz
diff --git a/build/crcPDO/build_exp.sh b/build/crcPDO/build_exp.sh
@@ -4,8 +4,8 @@ set -euo pipefail
 trap 'echo "Error on or near line $LINENO while executing: $BASH_COMMAND"; exit 1' ERR
 
 # running the drug python script
-echo "Running 04-experiments-crcPDO.py with token, samples file $1 and drugs file $2."
-python3 04-experiments-crcPDO.py --Download --Experiment --Token $SYNAPSE_AUTH_TOKEN --Samples $1 --Drugs $2
+echo "Running 04-experiments-crcpdo.py with token, samples file $1 and drugs file $2."
+python3 04-experiments-crcpdo.py --Download --Experiment --Token $SYNAPSE_AUTH_TOKEN --Samples $1 --Drugs $2
 
 # running the drug descriptor python script
-python3 fit_curve.py --input /tmp/crcPDO_experiments_for_curve_fitting.tsv --output /tmp/crcPDO_experiments.tsv
+python3 fit_curve.py --input /tmp/crcpdo_experiments_for_curve_fitting.tsv --output /tmp/crcpdo_experiments.tsv
diff --git a/build/crcPDO/build_omics.sh b/build/crcPDO/build_omics.sh
@@ -3,5 +3,5 @@ set -euo pipefail
 
 trap 'echo "Error on or near line $LINENO while executing: $BASH_COMMAND"; exit 1' ERR
 
-echo "Running 02-omics-crcPDO.py with token, curSamples $2, and genes $1."
-python3 02-omics-crcPDO.py --parse --transcriptomics --mutations --copy_number --ids $2 --genes $1
+echo "Running 02-omics-crcpdo.py with token, curSamples $2, and genes $1."
+python3 02-omics-crcpdo.py --parse --transcriptomics --mutations --copy_number --ids $2 --genes $1
diff --git a/build/crcPDO/build_samples.sh b/build/crcPDO/build_samples.sh
@@ -3,6 +3,6 @@ set -euo pipefail
 
 trap 'echo "Error on or near line $LINENO while executing: $BASH_COMMAND"; exit 1' ERR
 
-echo "Running 01-createSamples-crcPDO.py with token and prevSamples $1."
+echo "Running 01-createSamples-crcpdo.py with token and prevSamples $1."
 #   download the data and then create sample sheet  
-python3 01-samples-crcPDO.py  --download --samples --token $SYNAPSE_AUTH_TOKEN --prevSamples $1
+python3 01-samples-crcpdo.py  --download --samples --token $SYNAPSE_AUTH_TOKEN --prevSamples $1
diff --git a/build/docker/Dockerfile.crcPDO b/build/docker/Dockerfile.crcPDO
@@ -38,14 +38,14 @@ ENV MPLCONFIGDIR=/app/tmp/matplotlib
 RUN mkdir -p /app/tmp/matplotlib
 
 
-ADD build/crcPDO/requirements.R .
+ADD build/crcpdo/requirements.R .
 # installing r libraries
 RUN Rscript requirements.R
 
 
 
 # installing python libraries
-ADD build/crcPDO/requirements.txt .
+ADD build/crcpdo/requirements.txt .
 #RUN /opt/venv/bin/pip3 install -r requirements.txt
 RUN pip3 install -r requirements.txt
 
@@ -54,8 +54,8 @@ RUN which Rscript
 
 #ENV PATH="/opt/venv/bin:$PATH"
 
-ADD build/crcPDO/CNV-segfile-annotation.R ./
-ADD build/crcPDO/*py ./
-ADD build/crcPDO/*sh ./
+ADD build/crcpdo/CNV-segfile-annotation.R ./
+ADD build/crcpdo/*py ./
+ADD build/crcpdo/*sh ./
 
 ADD build/utils/* ./
diff --git a/build/docker/docker-compose.yml b/build/docker/docker-compose.yml
@@ -105,11 +105,11 @@ services:
     platform: linux/amd64
     image: upload:latest
 
-  crc_organoids:
+  crcpdo:
     build:
       context: ../../
-      dockerfile: build/docker/Dockerfile.crc_organoids
+      dockerfile: build/docker/Dockerfile.crcpdo
       args:
         HTTPS_PROXY: ${HTTPS_PROXY}
     platform: linux/amd64
-    image: crc_organoids:latest
+    image: crcpdo:latest