Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
seml:seml [2023/07/21 20:37]
127.0.0.1 external edit
seml:seml [2024/02/04 17:15]
user
Line 27: Line 27:
 |4.| Совместная разработка. Непрерывная интеграция. Гибкие процессы разработки. | |4.| Совместная разработка. Непрерывная интеграция. Гибкие процессы разработки. |
 |5.| Процесс анализа данных. Исследовательский анализ (EDA). Представление результатов. | |5.| Процесс анализа данных. Исследовательский анализ (EDA). Представление результатов. |
-|6.| Тестирование систем анализа данных. Методы модульного тестирования. Инструменты. | +|6.| Повторное использование. Объектные методы. Структуры репозиториев. | 
-|7.| Тестирование инвариантами. Adversarial testing. Тестирование наукоемкого ПО. | +|7.| Тестирование систем анализа данных. Методы модульного тестирования. Инструменты автоматизации поставки, контейнеризация. | 
-|8.| Введение в Domain Driven DesignМикросервисы и DevOps. Контейнеризация Docker. | +|8.| Тестирование инвариантами. Adversarial testing. Тестирование наукоемкого ПО. | 
-|9.| Реализация микросервисов в Python для поставки моделей. Создание API. Принципы REST и HATEOAS. | +|9.| Проблема повторяемости экспериментов. Что входит в эксперимент. Конфигурация. Лаборатория данных 
-|10.| Хранение данных. Релационная, колоночная, документная и др. модели. Транзакции ACID. Распределенные СУБД. CAP и BASE. | +|10.| Продуктивизация ML в виде сервисов. Реализация микросервисов в Python для поставки моделей. Создание API. Принципы REST и HATEOAS. | 
-|11.| Архитектуры систем Big Data. Обзор MapReduce. Лямбда архитектура. Технологический стек SMACK/CASK. | +|11.| Хранение данных. Релационная, колоночная, документная и др. модели. Транзакции ACID. Распределенные СУБД. CAP и BASE. | 
-|12.| Обработка данных в Spark/PySparkПредставление данных. RDDDataframeDataset. Оптимизация планов исполнения. | +|12.| Технологии параллельной обработки данных. Master/Slave, MapReduce, RDD(Spark)Если успеем - Kubernetes (podssvcsjobs, etc ) для размещения ML сервисов. Технологии GitOps, MLOps. | 
-|13.| Повторяемость экспериментов. Контроль версий данных. Процесс MLOps. Программные инструменты. |+|13.| Технологии сжатия и ускорение моделей. Средства представления API моделей. Стандартные протоколы. | 
  
  
 ==== Курсовой проект ==== ==== Курсовой проект ====
  
-Курсовой проект посвящен созданию собственного микросервиса с моделью машинного обучения в соответствии с процессами CI/CD.+Курсовой проект посвящен созданию собственного микросервиса с моделью машинного обучения в соответствии с процессами CI/CD или разработки повторно-используемой библиотеки с реализацией алгоритмом решения прикладной ML задачи.
  
 Задания выполняются в соответствии с процессом Scrum и CI/CD. Каждое задание - это отдельный спринт. Задания выполняются в соответствии с процессом Scrum и CI/CD. Каждое задание - это отдельный спринт.
Line 46: Line 47:
 |1.| Документирование и ревью кода | |1.| Документирование и ревью кода |
 |2.| Реализация модели. Структурирование программы | |2.| Реализация модели. Структурирование программы |
-|3.| Контейнеризация и модульное тестирование |+|3.| Автоматизация поставки и модульное тестирование |
 |4.| Тестирование. Непрерывная интеграция | |4.| Тестирование. Непрерывная интеграция |
-|5.| Реализация микросервиса. Использования СУБД | +|5.| Реализация микросервиса или микроесервиса. Использования СУБД. Воспроизводимое обучение 
-|6.| Размещение сервиса в облаке |+|6.| Размещение сервиса в облаке, публикация библиотеки. |