Feature/fixParseCNV #160

melferink · 2024-10-15T14:10:29Z

fixed bug in counting samples numbers due to multiple lanes

v7.5.5

Develop

Release/v7.5.5

fdekievit

Please see comments

ParseCNVQC/parse_cnv_qc.py

ParseCNVQC/tests/test_parse_cnv_qc.py

ParseCNVQC/tests/run3/SampleSheet.csv

ParseCNVQC/tests/run1/SampleSheet.csv

fdekievit · 2024-11-04T09:28:13Z

ParseCNVQC/parse_cnv_qc.py

@@ -62,6 +62,51 @@ def make_mail(today, daysago, attachment, run_status):
    send_email(settings.email_from, settings.email_to, subject, text, attachment)


+def get_number_samples_per_run_from_samplesheet(folder, rawfolder, projects, warnings):


ik zou hier de argumenten wat meer specifieker maken, b.v. run_folder ipv folder

fdekievit · 2024-11-04T09:31:53Z

ParseCNVQC/parse_cnv_qc.py

+    number_samples_run = 0
+    lanes = []
+    lane_index = ""
+    if os.path.exists("{}/SampleSheet.csv".format(folder)):


ik zie dat we vaan verschillende soorten python strings door elkaar gebruiken.
wat er nu staat is niet fout ofzo, maar zouden we misschien voor de nieuwere f-strings kunnen kiezen?

Dan zou deze zin:
if os.path.exists(f"{folder}/SampleSheet.csv"):
worden (en de rest van de strings worden dan ook net anders, maar dat scheelt weer text en het is meestal leesbaarder)

fdekievit · 2024-11-06T11:29:26Z

ParseCNVQC/parse_cnv_qc.py

+                            number_samples_run += 1
+                            if line.split(",")[lane_index] not in lanes:
+                                lanes.append(line.split(",")[lane_index])
+                if "Sample_ID" not in line:


sorry maar de logica klopt, alleen ik vind het niet heel leesbaar.

als ik het goed begrijp lezen we dus elke lijn van een samplesheet, en als we niet Sample_ID in de regel vinden gaan we door, maar als we in de else terecht komen gaan we een ander codeblock in waarin we dan in sample_section zitten.

ik denk dat een config parser hier de oplossing is:
https://docs.python.org/3/library/configparser.html
dan kan je een config section lezen uit een samplesheet a la
import configparser
config = configparser.ConfigParser()
samplesheet = config.read(samplesheet_path)

je hebt dan 1 sample block met alle samples, en die kan je makkelijk filteren met een for-loopje ofzo.

is een idee, wellicht werkt t niet, maar t proberen waard :)

fdekievit · 2024-11-06T11:40:14Z

ParseCNVQC/parse_cnv_qc.py

+    # prevent division by zero.
+    if len(lanes) > 0:
+        rawfolder[folder][1] += number_samples_run/len(lanes)
+    return rawfolder, warnings


mocht er tijd voor zijn, hou dit stukje dan eens kritisch tegen het licht.

op dit moment zit er namelijk logica in de functie om het aantal samples in een samplesheet te bepalen, maar het doet ook dingen daar buitenom, b.v. een dict bijhouden met het aantal samples per project. eigenlijk mag dat best zijn eigen functie zijn.

en een mooi voorbeeldje van code die heerlijk zou werken met OO!
dan kan je gewoon een run object maken dat 1 of meerdere projects heeft en de determine_samples uitvoeren op een run object, die het op alle (gefilterde) project lijst uitvoert

rernst and others added 8 commits September 10, 2024 13:59

Merge pull request #155 from UMCUGenetics/refsetupdate/RS-CREv4-2024-4

5004878

v7.5.5

Merge pull request #158 from UMCUGenetics/develop

4e23864

Develop

Merge pull request #159 from UMCUGenetics/release/v7.5.5

2f9b3b3

Release/v7.5.5

fixed number of sample parsing and made new function

e9de2c1

Modified docstring

cd73f38

flake8 changes

33f9eb5

refactor

2a80c39

added tests

97a7443

fdekievit requested changes Oct 18, 2024

View reviewed changes

ParseCNVQC/parse_cnv_qc.py Outdated Show resolved Hide resolved

ParseCNVQC/tests/test_parse_cnv_qc.py Outdated Show resolved Hide resolved

ParseCNVQC/tests/run3/SampleSheet.csv Outdated Show resolved Hide resolved

ParseCNVQC/tests/run1/SampleSheet.csv Outdated Show resolved Hide resolved

melferink added 2 commits October 21, 2024 11:23

changed function name and split tests

37529c8

removed typo

5a189d3

melferink requested a review from fdekievit October 21, 2024 11:14

fdekievit reviewed Nov 6, 2024

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Feature/fixParseCNV #160

Feature/fixParseCNV #160

melferink commented Oct 15, 2024

fdekievit left a comment

fdekievit Nov 4, 2024

fdekievit Nov 4, 2024

fdekievit Nov 6, 2024

fdekievit Nov 6, 2024

		@@ -62,6 +62,51 @@ def make_mail(today, daysago, attachment, run_status):
		send_email(settings.email_from, settings.email_to, subject, text, attachment)


		def get_number_samples_per_run_from_samplesheet(folder, rawfolder, projects, warnings):

Feature/fixParseCNV #160

Are you sure you want to change the base?

Feature/fixParseCNV #160

Conversation

melferink commented Oct 15, 2024

fdekievit left a comment

Choose a reason for hiding this comment

fdekievit Nov 4, 2024

Choose a reason for hiding this comment

fdekievit Nov 4, 2024

Choose a reason for hiding this comment

fdekievit Nov 6, 2024

Choose a reason for hiding this comment

fdekievit Nov 6, 2024

Choose a reason for hiding this comment