- Заменить
unittests
наpytests
- Заменить
setup.py
наpyproject.toml
- Все строковые значения свойств и наименования свойств слова заменить на численные 0-255. Например,
'preposition'
станетPREPOSITION
, гдеPREPOSITION
=0
. Причём зарезервировать специальные коды для значения:0
- свойство отсутствует,255
- значение свойства может быть любым, но должно быть - избавиться от использования индексов в анализах. Индексы применять только на низком уровне.
- заменить camelCase на snake_case в названии методов и функций
- вместо словаря для обозначения символа добавить класс Symbol(BaseUnit)
- объект Relation унаследовать от объекта базы (или подобного), чтобы в модуле конвеотации передавать только модуль базы.
- переименовать extractor в separator
- адаптировать для работы в одном потоке
- дописать модуль базы на словарях
- сделать графематический и морфологический модуль для русского языка (на основе pymorphy2)
- Добавить русский язык
- Добавить английский язык
- Поддержка условий