SOBES — это AI-ассистент для прохождения технических собеседований в режиме реального времени. Программа слушает вопросы интервьюера (системный звук) и ваши ответы (микрофон), мгновенно транскрибирует речь и генерирует подсказки с помощью локальных нейросетей (Ollama), помогая отвечать на сложные вопросы.
От автора: Я сделал этот проект, основываясь на идее доступного помощника. Сразу предупреждаю: проект не доведен до идеала, и я выкладываю его как Open Source основу. Если у вас есть идеи — берите код, улучшайте и не пишите всё с нуля.
⚠️ 99% VibeCoding — Проект создан в образовательных целях. Используйте ответственно.
- 🎙 Реальное время: Мгновенная транскрипция речи собеседника и кандидата с использованием
Faster-Whisper. - 🧠 Локальный AI: Полная интеграция с Ollama. Поддержка любых моделей: Qwen 2.5 Coder, Llama 3, DeepSeek и др.
- ⚡ Скорость: Оптимизировано для работы на GPU (CUDA). Мгновенный вывод ответов без эффекта "печати".
- 🕵️ Скрытый режим (Stealth):
- Оверлей поверх всех окон.
- Регулируемая прозрачность.
- "Режим призрака" (прокликиваемость).
- Мгновенное скрытие по горячей клавише (
F2).
- ⚙️ Гибкая настройка: Управление задержками тишины (VAD), чувствительностью микрофона и системными промптами.
- 📋 Буфер обмена: Возможность вручную отправить текст из буфера в AI (
F3).
Для комфортной работы рекомендуется наличие видеокарты NVIDIA, так как нейросети требуют вычислительной мощности.
- OS: Windows 10 / 11
- Python: 3.10 или новее
- GPU: NVIDIA GeForce RTX 3060 / 4060 и выше (рекомендуется от 6GB VRAM).
- На CPU работать будет, но со значительными задержками.
- Software: Установленный Ollama.
1. Подготовка окружения
Убедитесь, что у вас установлен Python и Git. Также скачайте и установите Ollama с официального сайта.
2. Клонирование репозитория
git clone [https://github.com/FullstackDepression/SOBES.git](https://github.com/FullstackDepression/SOBES.git)
cd SOBES
3. Установка зависимостей
Рекомендуется использовать виртуальное окружение:
Windows:
python -m venv venv
venv\Scripts\activate
Linux / Mac:
python3 -m venv venv
source venv/bin/activate
Установите необходимые библиотеки:
pip install -r requirements.txt
(Если файла requirements.txt нет, установите основные пакеты вручную: pip install PyQt6 requests soundcard numpy faster-whisper keyboard qtawesome psutil)
4. Скачивание модели (Первый запуск)
Перед запуском убедитесь, что в Ollama скачана нужная модель (по умолчанию в конфиге стоит qwen2.5-coder:14b, но для карт с <12GB памяти лучше взять 7b):
ollama pull qwen2.5-coder:7b
python main.py
При первом запуске программа может загружаться чуть дольше (инициализация Whisper и загрузка модели в VRAM).
- F2: Скрыть / Показать окно (Boss key).
- F3: Отправить содержимое буфера обмена в AI (если нужно спросить текстом).
- Интерфейс:
- Кнопка 👁 (Глаз): Включить режим прозрачности (Stealth).
- Кнопка ⚙️ (Шестеренка): Настройки (выбор модели, микрофона, задержек).
Все настройки сохраняются в файле sobes_data/settings.json. Вы можете менять их через интерфейс программы:
- Модель Ollama: Выберите ту, которая влезает в вашу видеопамять.
- Silence Delay: Задержка тишины. Увеличьте, если программа перебивает вас на полуслове.
- System Prompt: Инструкция для AI (как ему себя вести, роль, стиль ответов).
Если у вас есть идеи по улучшению или вы нашли баг — создавайте Issue или присылайте Pull Request. Буду рад любой помощи!
Этот проект распространяется под лицензией MIT License. Подробнее см. файл LICENSE.
*Developed by FullstackDepression*