HW4_Sapozhnikov #22

NSapozhnikov · 2023-10-01T09:36:10Z

No description provided.

Add check_input() to check the validity of the input in main() Add local_alignment() to perform Smith-Waterman algorithm Add prettify_alignment() to prettify the view of an alignment

…nction

…ctions

Hw4 nekrasova

PR local alignment functionality

…breaks

code improvement

Recode sequences

Chaned order of functions

nvaulin

Привет!

❗️ Напоминание напомнить всем членам команды посмотреть фидбек.

Классная работа! Общие моменты:

Структура коммитов где то хорошая, а где то не очен.
- Вот это хороший коммит Add local alignment function
- Вот этот стоило бы разбить Add local alignment functionality
- Некоторые коммиты называются с маленькой буквы
- У этого коммита комментарий не соотвествует названию фунции (при чем я не вижу коммитов сообщение которых соотвествует переименованию). Add gc_content function
Были небольшие проблемы со структурой репозитория. В данном случае .gitignore не надо было добавлять в git. Тем не менее хорошо что вы их пофиксили и очистили все ненужные файлы. Молодцы! (но в следующий раз сразу будьте аккуратнее)
README хорошое. Здорово что описаны все примеры и опции использования. Ссылка на алгоритм это правильно. Тем не менее, можно было бы, например, не делать столько горизонтальных линий. Все таки у вас они в основном там, где по идее нужен просто bullet-list. Здорово что описали список авторов и зон отвественности.
По коду - в основном хороший код.
- Почти везде чистый, были пару моментов с плохими неймингами, лишними пустыми строками, пробелами и .т.д.
- Отдельно хочу подчеркнуть понятие консистентности. Даже если можно сделать по-разному, в рамках одного проекта лучше stick to один какой-то способ.
- Круто что сделали словари-константы. Хорошие докстринги, для внутренних функций я даже ожидал бы чуть менее подробные. В общем молодцы.
- Есть кое-где какие-то неочевидные вещи, которые я старался прокомментировать.
- С общим дизайном тоже все хорошо но не идеально. Так, у вас некоторые функции итерируются по белкам, а некоторые принимают только один белок. Где-то у вас повторяются проверки, хотя есть специальная функция для этого. Ну и функция эта кажется не только делает проверки, но и как-то обрабатывает ввод, что уже не очень хорошо. А еще какие то функции у вас ждут однобуквенный код, а какие-то трехбуквенный. Вот тут я совсем потрялся. Хорошо что они могут конвертировать в нужный себе формат, но опять же, почему не консистентно?

Комментарии по функциям:

Функция recode возвращает ответ в виде словаря, но как-то странно.
Там {3-letter code : 1-letter code}
То есть запустив код main('MNT', method = 'recode') я бы ожидал получить MetAsnThr, или хотя бы {'MNT': 'MetAsnThr'} (запрос : ответ). А у вас получается наоборот. Я вашу логику понимаю, но я бы такого от тула никогда б не ожидал))
main('MNT', 'MNT', method='local_alignment') дает ошибку (local variable 'seq_on' referenced before assignment). При чем кажется падает на чекере. Проверьте.
И еще кажется я не могу подать однобуквенное выравнивание на вход алайнера. И еще когда я вызываю на двух одинаковых посдедовательностях, он мне почему-то выдает выравнивание лишь одной буквы))

main('AlaValTyrAlaValTyr', 'AlaValTyrAlaValTyr', method='local_alignment')
A
|
A

Если я подаю на запрос, например, M, то я получаю ответ для Met. Тоже не хорошо. Я получается должен знать, что сделать запрос я могу в любой форме, но чтобы получить результат мне надо че то еще перекодировать ( в смысле чтобы достать ответ из словаря). В общем не очень хорошо. Я как попросил так и хочу получить ответ. Скорее всего у меня там же пайплайн какой то. Ну и + когда я отдаю один белок на вычисление массы, я бы сразу хотел получить число, а не словарь с числом. Как в домашке по ДНК РНК.

Баллы.

README 2.4/2.5
local_alignment 0.5/1.5 (круто, но не работает))
Остальные функции 4*1.3/1.5 = 5.2/6 (см. комменты по формату вывода)
За структуру коммитов -0.1
За проблемы с пустыми строками / обрывами строк / пробелами -0.2
За проблемы с неймингами кое-где -0.3
За небольшие проблемы с общим дизайном, логикой и консистентностью -0.3

За 2 другие поставлю по +0.4 т.к. они работают. В любом случае, в зачет идут только 5, это небольшой бонус, т.к. вы потеряли много на выравнивателе. С одной стороны, здорово что попробовали, с другой же лучше выдавать надежно готовый продукт.

Итого: 8 баллов

HW4_Sapozhnikov/README.md

nvaulin · 2023-10-02T08:09:46Z

HW4_Sapozhnikov/README.md

+### Overview
+`prototool.py` includes 7 methods to treatment of polyaminoacid sequences.
+`prototool.py` can be used for the next goals:
+- recoding 1-letter coded polyaminoacid seqeunces into 3-letter coded and vice versa;


Suggested change

- recoding 1-letter coded polyaminoacid seqeunces into 3-letter coded and vice versa;

- recoding 1-letter coded polyaminoacid seqeunces into 3-letter coded and *vice versa*;

nvaulin · 2023-10-02T08:10:21Z

HW4_Sapozhnikov/README.md

+- determining polyaminoacid isoelectric point;
+- calculating polyaminoacid molecular weight;


Suggested change

- determining polyaminoacid isoelectric point;

- calculating polyaminoacid molecular weight;

- calculating polyaminoacid isoelectric point;

- calculating polyaminoacid molecular weight;

nvaulin · 2023-10-02T08:12:50Z

HW4_Sapozhnikov/README.md

+
+### Examples
+
+def recode allows to translate 1-letter to 3-letters polyaminoacids code


Suggested change

def recode allows to translate 1-letter to 3-letters polyaminoacids code

Function `recode` translates 1-letter to 3-letters polyaminoacids code

nvaulin · 2023-10-02T08:13:25Z

HW4_Sapozhnikov/README.md

+- `main('AlaValTyr', 'DNT', method = 'recode')`
+- `recode('AlaValTyr', 'DNT')`
+- ![image](https://github.com/NSapozhnikov/HW4_Sapozhnikov/assets/81642791/117befa5-feaa-433a-9ac9-23cffe9b024f)
+***


Тут между примерами имхо эти линии не нужны, а то совсем README получается рсчерченым в линеечку

nvaulin · 2023-10-02T12:12:21Z

HW4_Sapozhnikov/prototool.py

+    Args:
+    - *args - are supposed to be all sequences to process
+    - method is a kwarg - the method to process with.
+
+    Returns:
+    function_result - a dictionary with the result of a chosen function


👍
Очень хорошое решение убрать белки в позиционные аргументы а метод сделать именованным. Супер.

nvaulin · 2023-10-02T12:27:21Z

HW4_Sapozhnikov/prototool.py

+    print(f'Your sequences are: {seqs_list}',
+          f'The method is: {method}', sep='\n')


Ну это не уверен что нужно. А если сиквенсов много? Вы же не хотите чтобы человек прям все перечитывалт Тогда это можно и убрать.

nvaulin · 2023-10-02T12:28:17Z

HW4_Sapozhnikov/prototool.py

+    print(f'Your sequences are: {seqs_list}',
+          f'The method is: {method}', sep='\n')
+
+    match method:


Тут какие то лишние пустые строки везде)

nvaulin · 2023-10-02T12:29:53Z

HW4_Sapozhnikov/prototool.py

+            for seq in seqs_list:
+                recode_dict[seq] = recode(seq=seq)


Не совсем понял. У вас часть функций типа recode принимает 1 белок и у вас цикл по белкам тут. А часть функций типа молекулярной массы и pI - принимают все белки и цикл внутри них. Имхо лучше первый вариант, но в любом случае должно быть консистентно

nvaulin · 2023-10-02T12:31:15Z

HW4_Sapozhnikov/prototool.py

+
+        case 'count_gc_content':
+
+            return count_gc_content(*seqs_list)


Мне кажется лучше везде делать result = ... и потом делать return result. Просто, мало ли вы захотите как то еще добавить обработку результата, или еще что. Один return в конце мне кажется чуть более аккуратно и проще масштабируется.

nvaulin

Привет!

❗️ Напоминание напомнить всем членам команды посмотреть фидбек.

Классная работа! Общие моменты:

Структура коммитов где то хорошая, а где то не очен.
- Вот это хороший коммит Add local alignment function
- Вот этот стоило бы разбить Add local alignment functionality
- Некоторые коммиты называются с маленькой буквы
- У этого коммита комментарий не соотвествует названию фунции (при чем я не вижу коммитов сообщение которых соотвествует переименованию). Add gc_content function
Были небольшие проблемы со структурой репозитория. В данном случае .gitignore не надо было добавлять в git. Тем не менее хорошо что вы их пофиксили и очистили все ненужные файлы. Молодцы! (но в следующий раз сразу будьте аккуратнее)
README хорошое. Здорово что описаны все примеры и опции использования. Ссылка на алгоритм это правильно. Тем не менее, можно было бы, например, не делать столько горизонтальных линий. Все таки у вас они в основном там, где по идее нужен просто bullet-list. Здорово что описали список авторов и зон отвественности.
По коду - в основном хороший код.
- Почти везде чистый, были пару моментов с плохими неймингами, лишними пустыми строками, пробелами и .т.д.
- Отдельно хочу подчеркнуть понятие консистентности. Даже если можно сделать по-разному, в рамках одного проекта лучше stick to один какой-то способ.
- Круто что сделали словари-константы. Хорошие докстринги, для внутренних функций я даже ожидал бы чуть менее подробные. В общем молодцы.
- Есть кое-где какие-то неочевидные вещи, которые я старался прокомментировать.
- С общим дизайном тоже все хорошо но не идеально. Так, у вас некоторые функции итерируются по белкам, а некоторые принимают только один белок. Где-то у вас повторяются проверки, хотя есть специальная функция для этого. Ну и функция эта кажется не только делает проверки, но и как-то обрабатывает ввод, что уже не очень хорошо. А еще какие то функции у вас ждут однобуквенный код, а какие-то трехбуквенный. Вот тут я совсем потрялся. Хорошо что они могут конвертировать в нужный себе формат, но опять же, почему не консистентно?

Комментарии по функциям:

Функция recode возвращает ответ в виде словаря, но как-то странно.
Там {3-letter code : 1-letter code}
То есть запустив код main('MNT', method = 'recode') я бы ожидал получить MetAsnThr, или хотя бы {'MNT': 'MetAsnThr'} (запрос : ответ). А у вас получается наоборот. Я вашу логику понимаю, но я бы такого от тула никогда б не ожидал))
main('MNT', 'MNT', method='local_alignment') дает ошибку (local variable 'seq_on' referenced before assignment). При чем кажется падает на чекере. Проверьте.
И еще кажется я не могу подать однобуквенное выравнивание на вход алайнера. И еще когда я вызываю на двух одинаковых посдедовательностях, он мне почему-то выдает выравнивание лишь одной буквы))

main('AlaValTyrAlaValTyr', 'AlaValTyrAlaValTyr', method='local_alignment')
A
|
A

Если я подаю на запрос, например, M, то я получаю ответ для Met. Тоже не хорошо. Я получается должен знать, что сделать запрос я могу в любой форме, но чтобы получить результат мне надо че то еще перекодировать ( в смысле чтобы достать ответ из словаря). В общем не очень хорошо. Я как попросил так и хочу получить ответ. Скорее всего у меня там же пайплайн какой то. Ну и + когда я отдаю один белок на вычисление массы, я бы сразу хотел получить число, а не словарь с числом. Как в домашке по ДНК РНК.

Баллы.

README 2.4/2.5
local_alignment 0.5/1.5 (круто, но не работает))
Остальные функции 4*1.3/1.5 = 5.2/6 (см. комменты по формату вывода)
За структуру коммитов -0.1
За проблемы с пустыми строками / обрывами строк / пробелами -0.2
За проблемы с неймингами кое-где -0.3
За небольшие проблемы с общим дизайном, логикой и консистентностью -0.3

За 2 другие поставлю по +0.4 т.к. они работают. В любом случае, в зачет идут только 5, это небольшой бонус, т.к. вы потеряли много на выравнивателе. С одной стороны, здорово что попробовали, с другой же лучше выдавать надежно готовый продукт.

Итого: 8 баллов

Co-authored-by: Nikita Vaulin <[email protected]>

NSapozhnikov and others added 30 commits September 26, 2023 07:14

Initial commit

d98ccaf

Add local alignment function

42c89b3

Add local alignment functionality

873f7d7

Add check_input() to check the validity of the input in main() Add local_alignment() to perform Smith-Waterman algorithm Add prettify_alignment() to prettify the view of an alignment

start development from_proteins_seqs_to_rna function

86f281b

add cycles converting proteins to RNA in from_proteins_seqs_to_rna fu…

231efcc

…nction

add from_proteins_seqs_to_rna and isoelectric_point_determination fun…

09d4711

…ctions

add gitignore

1e98426

remove excess files

d6f1bfd

Minor code revision

f5e4308

Merge pull request #3 from NSapozhnikov/HW4_Nekrasova

c80ea15

Hw4 nekrasova

Merge branch 'dev' into local_alignment

3e337f7

Merge pull request #2 from NSapozhnikov/local_alignment

197d0a4

PR local alignment functionality

Add recode() function

c318a3a

add raise ValueError in from_proteins_seqs_to_rna function, add line …

96e209d

…breaks

Merge pull request #4 from NSapozhnikov/HW4_Nekrasova

ca4847a

code improvement

Add back_transcribe function

703249c

Add gc_content function

1ba062b

Add count_protein_molecular_weigh function

b21741c

Add recode() function

463dbf3

Merge branch 'dev' into recode_sequences

f19c48e

Merge pull request #5 from NSapozhnikov/recode_sequences

2d5e2de

Recode sequences

changed order of functions

a29692d

Changed order of functions

6ce8cf8

changed order of functions

5cc5a9b

Merge branch 'dev' into dev_Alina

3d32430

Merge pull request #7 from NSapozhnikov/dev_Alina

e359ad1

Chaned order of functions

Major code review and merging all functions together

be1abc5

Update README.md

05caf3c

Update README.md

1bdbb2f

Update README.md

3d76bb5

NSapozhnikov added 7 commits October 1, 2023 12:21

Update README.md

f32641a

Update README.md

9d6f687

Update README.md

9563f39

Update README.md

597f21b

Update README.md

f6a34ef

Update README.md

f6e10e8

Update README.md

fc97f7d

NSapozhnikov changed the title ~~Stable~~ HW4_Sapozhnikov Oct 1, 2023

nvaulin reviewed Oct 2, 2023

View reviewed changes

Update HW4_Sapozhnikov/README.md

ca5cf54

Co-authored-by: Nikita Vaulin <[email protected]>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

HW4_Sapozhnikov #22

HW4_Sapozhnikov #22

Uh oh!

NSapozhnikov commented Oct 1, 2023

Uh oh!

nvaulin left a comment

Uh oh!

Uh oh!

nvaulin Oct 2, 2023

Uh oh!

nvaulin Oct 2, 2023

Uh oh!

nvaulin Oct 2, 2023

Uh oh!

nvaulin Oct 2, 2023

Uh oh!

nvaulin Oct 2, 2023

Uh oh!

nvaulin Oct 2, 2023

Uh oh!

nvaulin Oct 2, 2023

Uh oh!

nvaulin Oct 2, 2023

Uh oh!

nvaulin Oct 2, 2023

Uh oh!

nvaulin left a comment

Uh oh!

Uh oh!

	- recoding 1-letter coded polyaminoacid seqeunces into 3-letter coded and vice versa;
	- recoding 1-letter coded polyaminoacid seqeunces into 3-letter coded and vice versa;

		- determining polyaminoacid isoelectric point;
		- calculating polyaminoacid molecular weight;


		### Examples

		def recode allows to translate 1-letter to 3-letters polyaminoacids code

	def recode allows to translate 1-letter to 3-letters polyaminoacids code
	Function `recode` translates 1-letter to 3-letters polyaminoacids code

		print(f'Your sequences are: {seqs_list}',
		f'The method is: {method}', sep='\n')

HW4_Sapozhnikov #22

Are you sure you want to change the base?

HW4_Sapozhnikov #22

Uh oh!

Conversation

NSapozhnikov commented Oct 1, 2023

Uh oh!

nvaulin left a comment

Choose a reason for hiding this comment

Баллы.

Uh oh!

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

nvaulin left a comment

Choose a reason for hiding this comment

Баллы.

Uh oh!

Uh oh!