LLM для Python-разработчиков: от RAG до агентов
Платный курс на Stepik: 8 модулей, 56 уроков — внедри LLM в свои Python-проекты без глубоких знаний ML.
Этот курс — гайд по внедрению LLM в продакшен для Python-разработчиков. Научитесь работать с эмбеддингами, RAG, дообучать модели и создавать multi-agent системы. Всё без PhD и мощных GPU, с акцентом на реальные инженерные задачи и продакшен-практики.
01Для кого этот курс
Курс универсальный, но точнее всего попадает в четыре аудитории. Если узнали себя — значит, программа собрана под вас.
02Что вы получите после курса
Конкретные навыки и артефакты, которые останутся у вас после прохождения — а не абстрактное «будете уверенно работать».
- Рабочий RAG-сервис на FastAPIВы спроектируете и реализуете полноценную Retrieval-Augmented Generation систему, интегрированную в FastAPI-приложение, готовую к развёртыванию.
- Кастомная LLM, дообученная на LoRAВы дообучите open-source модель (например, Mistral) на своих данных с помощью LoRA, используя даже бесплатные GPU в Colab, и сможете запускать её локально.
- Библиотека из 30+ промптовВы соберёте коллекцию эффективных промптов для различных задач, включая создание агентов и RAG-систем, на основе практических заданий курса.
- AI-микросервис для разработчикаВ рамках финального проекта вы создадите end-to-end AI-микросервис, который сможет выполнять функции ассистента разработчика.
- Навыки работы с LangChain и CrewAIВы освоите фреймворки LangChain и CrewAI для построения сложных агентов, управления их памятью и интеграции инструментов.
- Сертификат о прохождении StepikПосле успешного завершения всех модулей и финального проекта вы получите официальный сертификат от платформы Stepik.
03Программа курса
11 модулей · 56 уроков · 16 ч. Программа линейная — каждый модуль строится на предыдущем.
О курсе
- О курсе
Что такое LLM? · Осознанное взаимодействие с LLM: промпты, параметры, security · Выбор между облачными API и локальными моделями · Первый запрос к LLM · Установка и запуск LLM локально с помощью Ollama · Base-модели и instruct-модели: в чём разница и почему это важно · Эксперименты с промптами: few-shot и chain-of-thought · Закрепление материала
- Что такое LLM?
- Осознанное взаимодействие с LLM: промпты, параметры, security
- Выбор между облачными API и локальными моделями
- Первый запрос к LLM
- Установка и запуск LLM локально с помощью Ollama
- Base-модели и instruct-модели: в чём разница и почему это важно
- Эксперименты с промптами: few-shot и chain-of-thought
- Закрепление материала
Что такое embeddings (эмбеддинги)? · Векторные базы данных: зачем они и как работают? · Создание и поиск по эмбеддингам с Chroma · Переход на Qdrant: запуск через Docker и интеграция · Полезные практики: чанкинг, метаданные, reranking · Расширенные стратегии чанкинга и реранкинга · Закрепление материала
- Что такое embeddings (эмбеддинги)?
- Векторные базы данных: зачем они и как работают?
- Создание и поиск по эмбеддингам с Chroma
- Переход на Qdrant: запуск через Docker и интеграция
- Полезные практики: чанкинг, метаданные, reranking
- Расширенные стратегии чанкинга и реранкинга
- Закрепление материала
RAG с нуля: архитектура и первый рабочий пайплайн · RAG в продакшене: переключение на Qdrant и асинхронность · Оценка качества RAG · Защита от галлюцинаций и фильтрация ответов · Введение в агентов: LLM + инструменты (tools) · Stateful-агенты с LangGraph · Подготовка к продакшену: логирование, мониторинг, безопасность · Закрепление: финальный мини-проект
- RAG с нуля: архитектура и первый рабочий пайплайн
- RAG в продакшене: переключение на Qdrant и асинхронность
- Оценка качества RAG
- Защита от галлюцинаций и фильтрация ответов
- Введение в агентов: LLM + инструментыtools
- Stateful-агенты с LangGraph
- Подготовка к продакшену: логирование, мониторинг, безопасность
- Закрепление: финальный мини-проект
Почему RAG ломается в продакшене? Типичные сценарии · Защита RAG: от индексации до ответа · Мониторинг RAG в продакшене: логи, метрики, алерты · Оптимизация поиска: reranking и multi-query · Метаданные: основа безопасности и персонализации · Закрепление материала
- Почему RAG ломается в продакшене? Типичные сценарии
- Защита RAG: от индексации до ответа
- Мониторинг RAG в продакшене: логи, метрики, алерты
- Оптимизация поиска: reranking и multi-query
- Метаданные: основа безопасности и персонализации
- Закрепление материала
Когда локальные LLM — не просто «можно», а «нужно» · Выбор модели под задачу: не параметры, а измеримые метрики · Ollama в продакшене: как обернуть демон в надёжный сервис · Прямой inference через llama-cpp-python · Мониторинг и алертинг для локальных LLM · Решение типичных проблем в продакшене · Закрепление материала
- Когда локальные LLM — не просто «можно», а «нужно»
- Выбор модели под задачу: не параметры, а измеримые метрики
- Ollama в продакшене: как обернуть демон в надёжный сервис
- Прямой inference через llama-cpp-python
- Мониторинг и алертинг для локальных LLM
- Решение типичных проблем в продакшене
- Закрепление материала
Зачем дообучать модель и когда это оправдано · Дообучение через LoRA на бесплатной GPU (Google Colab) · Интеграция LoRA-адаптера в локальные LLM · Закрепление материала
- Зачем дообучать модель и когда это оправдано
- Дообучение через LoRA на бесплатной GPUGoogle Colab
- Интеграция LoRA-адаптера в локальные LLM
- Закрепление материала
Введение в multi-agent системы · Архитектура и оркестрация · Реализация на CrewAI · Альтернативы и расширения (Autogen, кастомизация)
- Введение в multi-agent системы
- Архитектура и оркестрация
- Реализация на CrewAI
- Альтернативы и расширенияAutogen, кастомизация
Архитектура и требования · Подготовка окружения и компонентов · Реализация RAG-поиска (POST /search) · Реализация генерации и сохранения (POST /generate) · Инфраструктура и тестирование · Компромиссы и пути развития
- Архитектура и требования
- Подготовка окружения и компонентов
- Реализация RAG-поискаPOST /search
- Реализация генерации и сохраненияPOST /generate
- Инфраструктура и тестирование
- Компромиссы и пути развития
Глоссарий курса · Тесты 1 · Тесты 2
- Глоссарий курса
- Тесты 1
- Тесты 2
Рекомендации по железу · Заключение
- Рекомендации по железу
- Заключение
04Как проходит обучение
Курс размещён на Stepik. Доступ остаётся навсегда, можно проходить в своём темпе.
Теория подается в формате конспектов с кодом и схемами, чтобы быстро усвоить материал.
Каждый модуль завершается заданиями с автоматической проверкой, чтобы закрепить материал.
Проверяйте свои знания с помощью тестов после каждого модуля.
Задавайте вопросы автору и обсуждайте архитектурные решения с другими студентами.
05Об авторе
Курс ведёт практикующий специалист, не «гуру». Все материалы — из живых проектов с реальными клиентами.
06Отзывы студентов
7 отзывов, средний рейтинг 5,0.
Идеальный стартовый шаг к нейросетям для разработчика без глубокого знания математики
Курс дает хорошее базовое понимание проблем, возникающих при разработке agentic RAG систем, и демонстрирует современные подходы к их решению. В качестве плюсов следует назвать: - курс имеет продуманную и логичную структуру - затронуты очень (на мой вкус) интересные темы -- reranking, дообучение, оценка качества RAG - достаточно подробно рассмотрен RAG -- как
Хороший курс. Автор активно улучшает и дополняет материал, дает фидбек в комментариях. Думаю со временем курс будет только лучше и лучше. Курс даем базовое понимание работы ии агентов и учит писать их самим.
Курс очень понравился. После прохождения стало гораздо понятнее, как устроен процесс разработки и как собрать рабочее приложение из разных частей. Особенно полезно было увидеть не только теорию, но и практический подход. Понравилась подача материала: все достаточно понятно и по делу.
07Частые вопросы
Если ответа нет — пишите в чат, ответим в течение суток.
Как оплатить курс в рассрочку?
Stepik предлагает варианты оплаты в рассрочку через сервисы Яндекс Сплит и Долями.
Как оплатить от компании?
На платформе Stepik предусмотрена возможность оплаты курса от юридического лица. Подробности можно уточнить в разделе помощи.

