Десктопное приложение для голосового ввода текста с использованием Google Gemini AI. Нажмите горячую клавишу, продиктуйте текст — и он автоматически вставится в любое активное поле ввода.
- Голосовой ввод в любое приложение — работает везде, где можно вставить текст
- Транскрипция через Gemini AI — высокое качество распознавания речи
- Настраиваемая горячая клавиша — запуск/остановка записи одной комбинацией
- Выбор модели Gemini — от быстрой Flash-Lite до мощной Pro
- Визуальный оверлей — индикация состояния записи и обработки
- Сворачивание в трей — приложение всегда под рукой
Готовый .exe файл можно скачать в моём портфолио:
https://t.me/NePavel_Workshop/37
- Python 3.10+
- Google Gemini API ключ (получить здесь)
# Клонировать репозиторий
git clone <repo-url>
cd GeminiVoiceWriter
# Создать виртуальное окружение
python -m venv .venv
.venv\Scripts\activate # Windows
# source .venv/bin/activate # Linux/Mac
# Установить зависимости
pip install -r requirements.txtpython main.py- Вставьте ваш Gemini API ключ
- Настройте горячую клавишу (по умолчанию
Alt+Ё) - Выберите модель:
- Flash — баланс скорости и качества (рекомендуется)
- Flash-Lite — для коротких команд, самая дешёвая
- Pro — для сложных текстов с редактированием
- 3.0 Pro Preview — максимальное качество
google-generativeai— API Google GeminiPyQt6— графический интерфейсpyaudio— запись аудиоkeyboard— глобальные горячие клавишиpyautogui— автоматическая вставка текстаpyperclip— работа с буфером обмена
pip install pyinstaller
pyinstaller GeminiVoiceWriter.specГотовый файл появится в папке dist/.
MIT