Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
seml:seml [2023/07/21 20:37]
127.0.0.1 external edit
seml:seml [2024/02/04 17:15] (current)
user
Line 27: Line 27:
 |4.| Совместная разработка. Непрерывная интеграция. Гибкие процессы разработки. | |4.| Совместная разработка. Непрерывная интеграция. Гибкие процессы разработки. |
 |5.| Процесс анализа данных. Исследовательский анализ (EDA). Представление результатов. | |5.| Процесс анализа данных. Исследовательский анализ (EDA). Представление результатов. |
-|6.| Тестирование систем анализа данных. Методы модульного тестирования. Инструменты. | +|6.| Повторное использование. Объектные методы. Структуры репозиториев. | 
-|7.| Тестирование инвариантами. Adversarial testing. Тестирование наукоемкого ПО. | +|7.| Тестирование систем анализа данных. Методы модульного тестирования. Инструменты автоматизации поставки, контейнеризация. | 
-|8.| Введение в Domain Driven DesignМикросервисы и DevOps. Контейнеризация Docker. | +|8.| Тестирование инвариантами. Adversarial testing. Тестирование наукоемкого ПО. | 
-|9.| Реализация микросервисов в Python для поставки моделей. Создание API. Принципы REST и HATEOAS. | +|9.| Проблема повторяемости экспериментов. Что входит в эксперимент. Конфигурация. Лаборатория данных 
-|10.| Хранение данных. Релационная, колоночная, документная и др. модели. Транзакции ACID. Распределенные СУБД. CAP и BASE. | +|10.| Продуктивизация ML в виде сервисов. Реализация микросервисов в Python для поставки моделей. Создание API. Принципы REST и HATEOAS. | 
-|11.| Архитектуры систем Big Data. Обзор MapReduce. Лямбда архитектура. Технологический стек SMACK/CASK. | +|11.| Хранение данных. Релационная, колоночная, документная и др. модели. Транзакции ACID. Распределенные СУБД. CAP и BASE. | 
-|12.| Обработка данных в Spark/PySparkПредставление данных. RDDDataframeDataset. Оптимизация планов исполнения. | +|12.| Технологии параллельной обработки данных. Master/Slave, MapReduce, RDD(Spark)Если успеем - Kubernetes (podssvcsjobs, etc ) для размещения ML сервисов. | 
-|13.| Повторяемость экспериментов. Контроль версий данных. Процесс MLOps. Программные инструменты. |+|13.| Технологии GitOps, MLOps. Технологии сжатия и ускорение моделей. Средства представления API моделей. Стандартные протоколы. | 
  
  
 ==== Курсовой проект ==== ==== Курсовой проект ====
  
-Курсовой проект посвящен созданию собственного микросервиса с моделью машинного обучения в соответствии с процессами CI/CD.+Курсовой проект посвящен созданию собственного микросервиса с моделью машинного обучения в соответствии с процессами CI/CD или разработки повторно-используемой библиотеки с реализацией алгоритмом решения прикладной ML задачи.
  
 Задания выполняются в соответствии с процессом Scrum и CI/CD. Каждое задание - это отдельный спринт. Задания выполняются в соответствии с процессом Scrum и CI/CD. Каждое задание - это отдельный спринт.
Line 46: Line 47:
 |1.| Документирование и ревью кода | |1.| Документирование и ревью кода |
 |2.| Реализация модели. Структурирование программы | |2.| Реализация модели. Структурирование программы |
-|3.| Контейнеризация и модульное тестирование |+|3.| Автоматизация поставки и модульное тестирование |
 |4.| Тестирование. Непрерывная интеграция | |4.| Тестирование. Непрерывная интеграция |
-|5.| Реализация микросервиса. Использования СУБД | +|5.| Реализация микросервиса или микроесервиса. Использования СУБД. Воспроизводимое обучение 
-|6.| Размещение сервиса в облаке |+|6.| Размещение сервиса в облаке, публикация библиотеки. |