Review RASA2 #28

nvaulin · 2024-02-26T17:57:17Z

Review RASA2

sme229 · 2024-05-03T19:59:48Z

RASA2.py

+        print(str(self.sequence))
+
+    def is_valid_alphabet(self):
+        valid_nucleotides = {'A', 'C', 'G', 'T', 'U'}


Можно было добавить проверку для строчных букв, либо перевести все в заглавные

sme229 · 2024-05-03T20:02:41Z

RASA2.py

+            if nucl.upper() == 'A':
+                transcribe_sequence += nucl
+            elif nucl.upper() == 'G':
+                transcribe_sequence += nucl
+            elif nucl.upper() == 'C':
+                transcribe_sequence += nucl


Как вариант, можно было бы это не писать и только рассматривать случай с T:

def transcribe(self): list_input = list(self.seq) for i in range(len(self.seq)): if (list_input[i] == 'T'): list_input[i] = 'U' elif (list_input[i] == 't'): list_input[i]='u' return "".join(list_input)

Или еще короче:

def transcribe(self) -> RNASequence: return RNASequence(str(self).translate(str.maketrans(('Tt'), ('Uu'))))

О, вот, с подсветкой и само предложение тоже супер

sme229 · 2024-05-03T20:03:46Z

RASA2.py

+                transcribe_sequence += nucl
+            elif nucl.upper() == 'C':
+                transcribe_sequence += nucl
+            elif nucl.upper() == 'T':


Не очень понимаю, если выполнен метод upper(), почему на следующей строчке рассмотрен вариант t строчной?

sme229 · 2024-05-03T20:09:59Z

RASA2.py

+
+
+class BiologicalSequence:
+    @abstractmethod


абстрактный метод задан верно, только можно добавить наследование:

class BiologicalSequence(ABC):

GlebBobkov · 2024-05-15T22:18:27Z

RASA2.py

+                 quality_threshold: int = 0, output_filename='') -> None:
+    seqs = SeqIO.parse(input_path, 'fastq')
+    if seqs is None:
+        raise ValueError('Your fastq_files are None')


тут не совсем понятный вывод получается. файла нет или файл пустой, лучше поменять или вывести потенциальные ошибки

GlebBobkov · 2024-05-15T22:21:26Z

RASA2.py

+    if not os.path.exists(output_dir):
+        os.mkdir(output_dir)
+
+    with open(os.path.join(output_dir, f'{output_filename}.fastq'), 'w') as fq:


хорошая конструкция, для того, что бы не забывать закрывать файл, но чуть проще читается код и чувствуется больше уверенености, когда в конце есть явное закрытие файла

GlebBobkov · 2024-05-15T22:22:27Z

RASA2.py

+                    length_bounds[1]:
+                gc_content = SeqUtils.GC123(record.seq)
+                if gc_bounds[1] >= gc_content[0] >= gc_bounds[0]:
+                    SeqIO.write(record, fq, 'fastq')


Suggested change

SeqIO.write(record, fq, 'fastq')

SeqIO.write(record, fq, 'fastq')

fq.close()

GlebBobkov · 2024-05-15T22:23:03Z

RASA2.py

+                    SeqIO.write(record, fq, 'fastq')
+
+
+class BiologicalSequence:


потерялось наследование)

GlebBobkov · 2024-05-15T22:25:47Z

RASA2.py

+        print(str(self.sequence))
+
+    def is_valid_alphabet(self):
+        valid_nucleotides = {'A', 'C', 'G', 'T', 'U'}


хорошая проверка нуклеиновых кислот, но они могут быть прописаны в другом регистре, тогда стоит добавить с нижним регистром тоже

GlebBobkov · 2024-05-15T22:27:28Z

RASA2.py

+                transcribe_sequence += nucl
+            elif nucl.upper() == 'T':
+                if nucl == 't':
+                    transcribe_sequence += 'u'


Это вероятно лишнее, потому что все в верхний регистр переводится же

GlebBobkov · 2024-05-15T22:33:18Z

RASA2.py

+                                                            3)]
+        for divided_acid in divided_acids:
+            if divided_acid not in self.AMINOACIDS_DICT.keys():
+                raise ValueError('Non-protein aminoacids in sequence')


тут стоит добавить какое-то объяснение для пользователей, вероятно пользователю будет не сразу понятна ошибка. Наличие проверки - хорошо, но её как будто бы лучше вынести перед работой или в самом начале функции

GlebBobkov · 2024-05-15T22:35:07Z

RASA2.py

+        for letter in self.sequence:
+            if letter not in self.TRANSCRIBE_DICT.keys():
+                return False
+        return True


Монжо чуть чуть изменить эту функцию, так она будет работать побыстрее

Suggested change

return True

valid_alphabet_set = set(self.TRANSCRIBE_DICT.keys())

return set(self.sequence).issubset(valid_alphabet_set)

Отличное замечание. Даже тут не только быстрее, но и просто более питонистый стиль. Не вручную копаем отдельные элементы коллекции, а используем более высокоуровневые методы самих коллекций.

GlebBobkov · 2024-05-15T22:39:57Z

RASA2.py

+        Parameters:
+        *parameters (str): Variable number of DNA or RNA sequences and the tool name.
+
+        Returns:


Это прям сильно. слишком подробно, в коде наверное стоит писать более емко все

GlebBobkov · 2024-05-15T22:41:40Z

RASA2.py

+    elif answer is None:
+        raise ValueError('Answer is None')
+    else:
+        return answer


Хорошая работа, она логичная и структурно выдержанная, чувствуется, что писалась самостоятельно, докстринга шикарно, но слишком развернутая, стоит чуть более емко писать, код воспринимается понятно и легко, осень хороший код))

Add RASA2.py

8431aab

sme229 reviewed May 3, 2024

View reviewed changes

GlebBobkov reviewed May 15, 2024

View reviewed changes

	SeqIO.write(record, fq, 'fastq')
	SeqIO.write(record, fq, 'fastq')
	fq.close()

	return True
	valid_alphabet_set = set(self.TRANSCRIBE_DICT.keys())
	return set(self.sequence).issubset(valid_alphabet_set)

Review RASA2 #28

Are you sure you want to change the base?

Review RASA2 #28

Uh oh!

Conversation

nvaulin commented Feb 26, 2024

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Uh oh!