PhotoDubl - это веб-приложение для поиска и удаления дубликатов фотографий, которое позволяет сканировать локальные и сетевые директории на наличие идентичных изображений. Приложение анализирует EXIF-данные, сравнивает метаданные и помогает принять решение о том, какие именно дубликаты стоит удалить.
- Сканирование до 5 локальных и сетевых (SMB/CIFS) директорий одновременно
- Автоматическое монтирование сетевых ресурсов
- Поиск идентичных фотографий на основе имени файла
- Анализ и сравнение EXIF-метаданных
- Подсветка различий в метаданных для принятия решения (в работе)
- Возможность отметить файлы для удаления
- Безопасное удаление отмеченных дубликатов
- Детальный отчет о результатах удаления
- Python 3.x
- Flask
- MongoDB
- Pillow (для обработки изображений)
- Bootstrap 5 (для интерфейса)
- jQuery
- CIFS/SMB для работы с сетевыми ресурсами
- Клонируйте репозиторий:
git clone https://github.com/ktibr0/work_with_duplicates
cd work_with_duplicates
- Перейдите в папку docker:
cd docker
- Запустите контейнер:
docker compose up -d
- Откройте веб-браузер и перейдите по адресу http://localhost:5000
- На главной странице укажите до 5 директорий для сканирования
- Если требуется, введите учетные данные для доступа к сетевым ресурсам
- Нажмите "Сканировать"
- После завершения сканирования просмотрите найденные группы дубликатов
- Отметьте файлы, которые хотите удалить (в каждой группе должен остаться хотя бы один файл)
- Нажмите "Отметить выбранные на удаление"
- Подтвердите удаление, нажав "Удалить отмеченные файлы"
- Просмотрите результаты удаления
- Python 3.6 или выше
- MongoDB
- Система с поддержкой монтирования CIFS/SMB ресурсов (Linux/Mac/Windows с WSL)
- Права на монтирование и размонтирование сетевых ресурсов
- Для работы с сетевыми ресурсами могут потребоваться дополнительные пакеты (cifs-utils в Linux)
PhotoDubl is a web application for finding and deleting duplicate photos that can scan local and network directories for identical images. The application analyzes EXIF data, compares metadata, and helps you decide which duplicates to delete.
- Scan up to 5 local and network (SMB/CIFS) directories simultaneously
- Automatic mounting of network resources
- Find identical photos based on filename
- Analyze and compare EXIF metadata
- Highlight differences in metadata to help decision making (WIP)
- Mark files for deletion
- Safely delete marked duplicates
- Detailed deletion results report
- Python 3.x
- Flask
- MongoDB
- Pillow (for image processing)
- Bootstrap 5 (for UI)
- jQuery
- CIFS/SMB for network resource handling
- Clone the repository:
git clone https://github.com/ktibr0/work_with_duplicates
cd work_with_duplicates
- Go to folder docker:
cd docker
- Run container:
docker compose up -d
- Open a web browser and go to http://localhost:5000
- On the main page, specify up to 5 directories to scan
- If required, enter credentials for accessing network resources
- Click "Scan"
- After scanning is complete, view the found duplicate groups
- Mark files you want to delete (at least one file must remain in each group)
- Click "Mark selected for deletion"
- Confirm deletion by clicking "Delete marked files"
- View deletion results
- Python 3.6 or higher
- MongoDB
- System with CIFS/SMB mounting support (Linux/Mac/Windows with WSL)
- Permissions to mount and unmount network resources
- Additional packages may be required for network resources (cifs-utils on Linux)