Um tradutor de legendas que utiliza modelos de Inteligência Artificial Open-Source.
- Visão Geral
- Funcionalidades
- Estrutura do Projeto
- Como Começar
- Testes
- Nota Importante
- Roadmap do Projeto
- Contribuindo
- Licença
- Agradecimentos
Sucata é uma ferramenta open-source projetada para extrair e traduzir legendas de arquivos .mkv
, além de processar diretamente arquivos .srt
, .ass
e .ssa
. Com uma interface amigável, o Sucata utiliza modelos de linguagem baseados em IA, como Llama, para fornecer traduções de alta qualidade enquanto preserva o contexto e o estilo dos diálogos originais.
-
Extração de Legendas:
- Compatível com faixas de legenda em arquivos MKV.
- Seleção de faixas via GUI para melhor usabilidade.
-
Tradução Inteligente:
- Suporte a arquivos
.srt
,.ass
e.ssa
. - Adaptação contextual de gírias, expressões culturais e tons emocionais.
- Suporte a arquivos
-
Interface Gráfica:
- Desenvolvida com
Tkinter
, oferece simplicidade e acessibilidade.
- Desenvolvida com
-
Suporte a Múltiplos Idiomas:
- Suporta diversos idiomas, incluindo Árabe, Bengali, Chinês Mandarim, Coreano, Espanhol, Francês, Hindi, Inglês, Indonésio, Japonês, Marathi, Português, Português Brasileiro, Punjabi Ocidental, Russo, Tâmil, Telegu, Turco, Urdu e Vietnamita.
└── sucata/
├── app.py # Arquivo principal do projeto
├── fonts/ # Fontes utilizadas na interface
│ ├── FKGroteskNeueTrial-Bold.otf
│ ├── FKGroteskNeueTrial-Regular.otf
│ └── Horizon.otf
├── img/ # Imagens do projeto
│ ├── sucata_hello.png
│ ├── sucata_icon.ico
│ ├── sucata_preview.jpeg
│ └── kofi_pt-BR.png
├── requirements.txt # Dependências do projeto
└── README.md # Readme universal
└── README-pt-BR.md # Este arquivo
- Python: Requer Python 3.9 ou superior.
- Pip: Gerenciador de pacotes do Python.
- Ferramentas Externas:
mkvextract
emkvmerge
para manipulação de arquivos MKV.
- Conta na Hugging Face (opcional): Necessária para acessar alguns modelos de IA, como Llama.
-
Clone o Repositório:
git clone https://github.com/pedronalis/sucata.git
-
Acesse o Diretório:
cd sucata
-
Instale as Dependências:
pip install -r requirements.txt
-
Configure o Modelo (opcional):
- Para usar modelos Llama ou Qwen, solicite acesso na Hugging Face.
- Caso não tenha acesso, utilize um modelo alternativo open-source.
- Execute o programa:
python app.py
- Na interface:
- Selecione um arquivo MKV ou de legenda (.srt/.ass/.ssa).
- Escolha o idioma de origem.
- Clique em Iniciar Tradução e acompanhe o progresso no log.
- Básico:
- Utilize um pequeno arquivo
.srt
para testar as traduções.
- Utilize um pequeno arquivo
- Avançado:
- Teste com arquivos MKV contendo várias faixas de legenda.
Este programa não substitui um tradutor profissional e não garante traduções 100% perfeitas. Embora utilize modelos avançados de Inteligência Artificial, podem ocorrer erros ou inadequações contextuais em algumas traduções.
Para melhorar os resultados, você pode personalizar o prompt no arquivo app.py
de acordo com o idioma e o estilo desejados. Isso pode ajudar a IA a produzir traduções mais adaptadas às suas necessidades.
- Lançamento Inicial: Tradução de legendas e extração de faixas.
- Implementar suporte para novos idiomas.
- Adicionar suporte para tradução em lote.
- Melhorar otimização de modelos com fine-tuning.
- Fork o Repositório e faça suas melhorias!
- Envie um Pull Request com suas alterações.
- Reporte Bugs ou sugira melhorias.
Este projeto é licenciado sob a GNU AGPL.
Sinta-se à vontade para contribuir! ❤️
- Hugging Face: Pelo suporte aos modelos open-source.
- Comunidade Tkinter: Pela documentação acessível.
- Todos os contribuidores e testers que ajudam a melhorar o projeto.