Từ điển tiếng Việt dành cho máy đọc sách Kindle, Kobo, Pocketbook, Boox v.v. cũng như trên điện thoại và máy tính, như StarDict, Lingvo, Yomichan/Yomitan, v.v.
Mã nguồn cho từ điển dành cho máy đọc sách Kindle. Để sử dụng từ điển, download tại đây http://catusf.github.io/.
- Setup môi trường
make setup
- Test môi trường
make test
- Build mẫu vài từ điển
make sample
- Build tất cả từ điển
make all
- Khi tạo khởi động CodeSpace để dev, thực hiện lệnh sau để đồng bộ SSH Private Key từ CodeSpace secret vào SSH Agent
eval $(ssh-agent -s)
ssh-add <(echo "$SSH_PRIVATE_TUDIEN_CODESPACE")
- Sync submodule về bằng lệnh
git submodule update --init --recursive
Do tôi thấy cần:
- Có các từ điển có chất lượng để giúp việc học hỏi của bản thân và mọi người
- Lập trình viên bất kỳ có thể dùng dữ liệu đầu vào ở đây để tạo output khác
- Có thể dễ dàng bổ sung từ điển - chỉ cần tạo 1 file văn bản phân cách bằng dấu \t (.tab) và 1 file mô tả .dfo
Các từ điển cần:
- Chính xác và dễ tra cứu
- Dùng được trên nhiều thiết bị (Kindle, Kobo, Onyx, mobile và PC apps)
- Cài Python 3.x
- Cài các package cần thiết
pip install -r requirements.txt
- Tạo mới hay sửa file định nghĩa từ điển (như
./dict/TudienCuatoi.tab
) - Tạo một file mô tả từ điển (như
./dict/TudienCuatoi.dfo
) - Chạy dòng lệnh
python ./bin/convert_all.py
để tạo từ điển. Kết quả sẽ có trong thư mụcoutput
Việc còn lại là copy file .mobi vừa được tạo ra bằng dây cáp USB vào thư mục documents
trên Kindle để bắt đầu sử dụng.
graph LR;
GenMetadat(File mô tả <.dfo>) --> GenTab(File định nghĩa <.tsv>);
GenTab -- tool tab2opf --> HTML_File(File <.opf/html>) -- mobigen --> KindleDict(Từ điển Kindle <.mobi>);
GenTab -- chạy PyGlossary --> EpubDict(Từ điển <.epub>);
GenTab -- chạy PyGlossary --> KoboDict(Từ điển Kobo <.kobo.zip>);
GenTab -- chạy PyGlossary --> StarDict(Từ điển StarDict <.ifo>);
GenTab -- chạy PyGlossary --> dictd(Từ điển dictd <.index>);
GenTab -- chạy PyGlossary --> Yomitan(Từ điển dictd <.zip>);
GenTab -- chạy DSL Tools --> DSLDict(Từ điển Lingvo <.dsl.dz>);
- Từ điển Hán Việt Thiền Chửu (9'897)
- Từ điển Anh Việt Beta (106'059 với 28'400 dạng từ thay thế - inflection)
- Từ điển phật học tổng hợp (49'569)
- Từ điển Phật Quang (16'973)
- Từ điển Phật học Việt Anh - Thiện Phúc (24'767)
- Từ điển Phật học Anh-Hán-Việt (3'914)
- Ngữ vựng Danh từ Thiền học (302)
- Từ điển Đạo Uyển (3'262)
- Từ điển Phật học Việt Anh - Đồng Loại (7'847)
- Từ điển Phật học Việt Anh - Minh Thông (9'113)
- Phật Quang Đại từ điển (Hán ngữ) (22'900)
- Rộng mở tâm hồn (1'347)
- Từ điển Phật học Tinh tuyển (2'918)