Review RHNO1 #34

nvaulin · 2024-02-26T17:57:33Z

Review RHNO1

uzunmasha

Привет! Хороший код! Структурированный и хорошо читаемый
Есть только пара косметических комментариев

uzunmasha · 2024-03-10T14:36:52Z

RHNO1.py

+        if min(record.letter_annotations["phred_quality"]) < self.min_quality:
+            return False
+
+        gc_content = gc_fraction(record.seq)


gc_content = GC(record.seq)
Для подсчета гц-состава можно использовать такой подход. Импортируется через from Bio.SeqUtils import GC

uzunmasha · 2024-03-10T14:38:02Z

RHNO1.py

+
+
+class NucleicAcidSequence(BiologicalSequence):
+    complement_dict = {"A": "", "T": "", "G": "", "C": ""}


Не очень поняла зачем здесь эта строка. Кажется, что она определяет словарь, который фактически не используется в классе NucleicAcidSequence, так как метод complement() использует словарь, определенный в дочерних классах DNASequence и RNASequence. Но лучше, конечно, чтобы в этом классе все определялось, а не в наследуемых.

uzunmasha · 2024-03-10T14:38:44Z

RHNO1.py

+        return self.sequence
+
+    def check_alphabet(self):
+        valid_alphabet = set("ATGC")


Вижу проверку на ДНК и на аминокислоты ниже, круто! Но не вижу на РНК, лучше ее тоже добавить

uzunmasha · 2024-03-10T14:39:13Z

RHNO1.py

+        return self.__class__(sequence)
+
+    def gc_content(self):
+        gc_count = sum(base in "GCgc" for base in self.sequence)


Круто, что проверяется регистр! Можно для проверки алфавита тоже такое добавить

uzunmasha · 2024-03-10T14:39:33Z

RHNO1.py

+    def __str__(self):
+        return self.sequence
+
+    def check_alphabet(self):


Можно еще прописать вывод ошибок, если подаются символы, отличные от ДНК/РНК/аминокислот, без них у меня работает вообще с любой последовательностью.

GlebBobkov · 2024-03-09T11:20:59Z

RHNO1.py

+
+    def filter_fastq(self):
+        with open(self.output_file, "w") as output_handle:
+            for record in SeqIO.parse(self.input_file, "fastq"):


тут можно было бы добавить тест на существование файла с последовательностью, который берется на вход, если его нет, то можно выводить ошибку о его отсутствии

Suggested change

for record in SeqIO.parse(self.input_file, "fastq"):

for record in SeqIO.parse(self.input_file, "fastq"):

if not self.input_file():

raise FileNotFoundError(f"Файл '{self.input_file}' не найден!")

GlebBobkov · 2024-03-09T11:21:25Z

RHNO1.py

+        self.min_length = min_length
+        self.min_quality = min_quality
+        self.min_gc = min_gc
+        self.max_gc = max_gc


все логично и понятно, что приходит на вход, хорошо, что прописаны автоматические минимальные значения

GlebBobkov · 2024-03-09T16:03:24Z

RHNO1.py

+
+
+class NucleicAcidSequence(BiologicalSequence):
+    complement_dict = {"A": "", "T": "", "G": "", "C": ""}


не совсем понятно для чего этот словарь, если я правильно понимаю, он дальше меняется, но вероятно, тогда стоит задать пустой словарь

GlebBobkov · 2024-03-09T16:08:17Z

RHNO1.py

+
+    def check_alphabet(self):
+        valid_alphabet = set("ATGC")
+        return set(self.sequence) <= valid_alphabet


хорошая проверка, на всякий случай можно добавить в сет значения с нижним регистром, или добавить при вводе последовательности перевод все в верхний регистр

GlebBobkov · 2024-03-09T16:10:05Z

RHNO1.py

+
+
+class DNASequence(NucleicAcidSequence):
+    complement_dict = {"A": "T", "T": "A", "G": "C", "C": "G"}


Вероятно этот комментарий супер вкусовщина. Более приятно читается словарь, когда он построчный. Но это сугубо вкусовщина

Suggested change

complement_dict = {"A": "T", "T": "A", "G": "C", "C": "G"}

complement_dict = {"A": "T",

"T": "A",

"G": "C",

"C": "G"}

следующие словарики я бы также подпарвил

GlebBobkov · 2024-03-09T16:20:44Z

RHNO1.py

+    complement_dict = {"A": "U", "U": "A", "G": "C", "C": "G"}
+
+    def codons(self):
+        return [self.sequence[i : i + 3] for i in range(0, len(self.sequence), 3)]


Может оказаться так, что последовательность не кратна 3, поэтому на такой случай стоит что-то придумать, например показывать пользователю ошибку

Suggested change

return [self.sequence[i : i + 3] for i in range(0, len(self.sequence), 3)]

if len(self.sequence) % 3 != 0:

raise ValueError("Sequence length is not a multiple of 3")

else:

return [self.sequence[i : i + 3] for i in range(0, len(self.sequence), 3)]

GlebBobkov · 2024-03-09T16:28:16Z

RHNO1.py

+            "V": 117.15,
+            "W": 204.23,
+            "Y": 181.19,
+        }


очень красивый словарик, легко читаемый

GlebBobkov · 2024-03-09T16:30:38Z

RHNO1.py

+            "W": 204.23,
+            "Y": 181.19,
+        }
+        return sum(molecular_weights[aa] for aa in self.sequence)


Это очень хорошая работа, она структурно логичная, приятно читается, нет лишних переменных и функций, что радует. Если добавить аннотации, то к работе будет самой идеальной, но она уже на высоте

Add RHNO1.py

7e7ffb6

uzunmasha reviewed Mar 10, 2024

View reviewed changes

GlebBobkov reviewed Apr 11, 2024

View reviewed changes



		class NucleicAcidSequence(BiologicalSequence):
		complement_dict = {"A": "", "T": "", "G": "", "C": ""}



		class DNASequence(NucleicAcidSequence):
		complement_dict = {"A": "T", "T": "A", "G": "C", "C": "G"}

Review RHNO1 #34

Are you sure you want to change the base?

Review RHNO1 #34

Uh oh!

Conversation

nvaulin commented Feb 26, 2024

Uh oh!

uzunmasha left a comment

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants