Навчальні AI-проєкти для практикантів, які можна реалізувати з базовими знаннями Python, машинного навчання та бібліотек типу scikit-learn, pandas, tensorflow, openCV, тощо:
1. Розпізнавання рукописних цифр (MNIST)
Що робить: Модель вгадує цифру від 0 до 9, написану від руки.
Технології: TensorFlow або PyTorch, датасет MNIST.
Цінність: Основи глибокого навчання, згорткові мережі.
2. Прогнозування оцінок студентів
Що робить: На основі годин навчання, присутності та завдань передбачає підсумкову оцінку.
Технології: pandas, scikit-learn.
Цінність: Практика з регресією та аналізом даних.
3. Чат-бот для відповідей на прості питання
Що робить: Відповідає на базові питання типу "Вітаю", "Яка погода?" тощо.
Технології: NLTK, Rasa або GPT-2 з fine-tuning.
Цінність: Введення в обробку природної мови (NLP).
4. Детектор емоцій за текстом
Що робить: Аналізує повідомлення і визначає емоцію: радість, сум, злість тощо.
Технології: nltk, scikit-learn, transformers.
Цінність: NLP + класифікація.
5. Система рекомендацій фільмів
Що робить: Пропонує фільми на основі вибору користувача
Технології: pandas, surprise, scikit-learn.
Цінність: Основи рекомендаційних систем (collaborative filtering).
6. Визначення спаму в email
Що робить: Класифікує лист як спам чи ні.
Технології: Naive Bayes, sklearn, NLP.
Цінність: Практика з текстовою класифікацією.
7. Детектор облич на фото
Що робить: Знаходить обличчя на зображенні.
Технології: OpenCV, Haar Cascades або Dlib.
Цінність: Практика з комп’ютерним зором. ---
8. Розпізнавання живої мови (speech-to-text)
Що робить: Конвертує аудіо у текст.
Технології: SpeechRecognition, pyaudio, google-speech-api.
Цінність: Основи роботи зі звуком.
9. Перекладач тексту (міні Google Translate)
Що робить: Перекладає текст з англійської на інші мови і навпаки.
Технології: transformers, HuggingFace models.
Цінність: Реальне застосування попередньо натренованих моделей.
10. Прогнозування цін на нерухомість
Що робить: На основі площі, розташування та інших параметрів передбачає ціну.
Технології: Лінійна регресія, pandas, matplotlib.
Цінність: Практичне застосування регресії у бізнесі.
Інженерно-бізнесові проєкти для студентів, що ставлять за мету мати достойну високооплачувану роботу галузі програмної інженерії та штучного інтелекту
1. AI-аналітик відгуків клієнтів
Ідея: Автоматичний аналіз тисяч клієнтських відгуків (з Google, Amazon, соцмереж тощо) для визначення позитивних/негативних трендів, основних проблем.
Комерційне застосування: Для e-commerce, сервісних компаній, ресторанів.
Технології: NLTK, spaCy, transformers (BERT), візуалізація з plotly.
2. Система динамічного ціноутворення
Ідея: Модель, що автоматично пропонує оптимальну ціну на товар залежно від попиту, конкурентів, сезону, залишку на складі.
Комерційне застосування: Інтернет-магазини, авіа/готельний бізнес.
Технології: pandas, xgboost, scikit-learn, time series analysis.
3. Автоматичне створення контенту для соцмереж
Ідея: Генерація описів, заголовків або постів (наприклад, для Instagram товарів) на основі короткого опису або ключових слів.
Комерційне застосування: SMM, маркетингові агентства, малі бізнеси.
Технології: OpenAI GPT, transformers, streamlit для інтерфейсу.
4. AI-помічник для рекрутерів
Ідея: Аналізує резюме та автоматично відбирає найкращих кандидатів за заданими критеріями.
Комерційне застосування: HR-відділи, рекрутингові агентства.
Технології: NLP, класифікація, побудова простого UI (Flask/Streamlit).
5. Відеоспостереження з виявленням підозрілої поведінки
Ідея: Аналіз потоку відео з камери й сигналізація при аномальній поведінці (довге стояння, різкі рухи тощо).
Комерційне застосування: Безпека магазинів, банків, офісів, навчаьних закладів та ін.
Технології: OpenCV, YOLO або MediaPipe, простий alert-сервер.
6. RAG-система для корпоративної документації
Ідея: Семантичний пошук по PDF, Confluence, Notion,
LLM + FAISS/Weaviate + LangChain
Комерційне застосування: Автоматизує підтримку та внутрішній пошук
7. AI-аналітик із природною мовою
Ідея: Інтеграція з CRM/ERP
Генерація звітів та пояснень на основі даних
Time-series аналіз (Prophet, NeuralForecast)
Комерційне застосування: Використання LLM для формування інсайтів
8. Відеоаналітика для ритейлу
Ідея: OpenCV + YOLOv8 для виявлення руху, підрахунку людей
Комерційне застосування: Побудова теплових карт (heatmap) для зони активності
Аналіз аномальної поведінки (тривале стояння, різкі рухи)
9. Персоналізована email-маркетинг платформа
Ідея: Генерація тексту листів на основі поведінки користувача
Комерційне застосування: Класифікація користувачів за RFM, намірами, ризиком відтоку
A/B тестування тем, часу, стилю
10. HR AI-асистент
Ідея: Парсинг CV з PDF/Word
Комерційне застосування: Семантичне зіставлення кандидатів до вакансій
Побудова рейтингу відповідності
Інтерфейс для сортування, фільтрації, збереження
11. Проєкти з Data Engineering (одного з ключових напрямів сучасної ІТ-індустрії) для студентів спеціальності F2/121 «Інженерія програмного забезпечення».
Опис типового проєкту: проєктування систем, що автоматично збирають, обробляють та зберігають великі обсяги даних, зокрема:
- ETL-пайплайни: побудова процесів, що отримують дані з різних джерел (API, бази даних, вебсайти), очищують і перетворюють їх для подальшого аналізу.
- Архітектура сховищ даних: проєктування структурованих середовищ для зберігання даних (Data Lake, Data Warehouse).
- Реалізація аналітичних систем: інтеграція даних для побудови звітів, дашбордів або автоматичного прийняття рішень.
- Оптимізація продуктивності: налаштування обробки великих обсягів даних із фокусом на швидкість, масштабованість і надійність.
Методи і технології: обєкно-орієнтоване програмування (Java, C++, Python), системний аналіз, Data- аналітикfи.
Комерційне застосування: автоматизоване інтелектуальне формування з окремих джерел «повної і єдиної правди» про бізнес — основа для прийняття стратегічних рішень.
12. Розробка інтелектуальних програмних AI-систем отримання знань для надзвичайних ситуацій
Деталі: https://rework-space.com/ua/blog/2024-12-01-rework-space-at-the-8th-cassini-hackathon/ (є можливість для студентів молодших курсів можливість долучитись до команди під час хакатонів)
Окремі загальні теми:
- Видобування знань із PDF документів на прикладі юридичних контрактів з використанням AI інструментів.
Технології, стек ПЗ: Python, MLflow, LangChain, AWS Textract, AWS Bedrock
- Формування оптимізованих запитів до SQL баз даних з використанням великих мовних моделей.
Технології, стек ПЗ: Python, MLflow, LangChain, AWS Textract, AWS Bedrock
13. Розробка Terraform провайдерів для налаштування складних систем з використанням підходів інфраструктура як код (IaC)
Технології, стек ПЗ: Go, GitHub actions
Деталі: https://github.com/rework-space-com/terraform-provider-freeipa
14 . Проєктування інтелектуальних програмних систем (ІПС) прикладного спрямування на основі AI-технологій, когнітивних процесів та інтелектуальних агентів:
1) ІПС визначення психологічних характеристик особистості на основі АІ-технологій інтелекту для обробки текстової інформації
2) ІПС визначення потоків семантичних векторів текстових даних та інформаційно-пошукових систем текстової інформації на основі систем інтелектуальних агентів.
3) ІПЗ нейроінтерфейсів мозок-комп'ютер та інтелектуальної обробки медичних зображень в системах діагностування.
4) ІПЗ генерування синтетичних даних на основі агентів штучного інтелекту та виявлення когнітивних процесів у АІ -агентів.
Цей перелік навчальних таінженерно-комерційних проєктів кафедри програмної інженерії буде постійно оновлюватись в процесі їх розвитку та нових перспективних застосувань