Будучи старшим архитектором решений в Databricks, помимо взаимодействия с клиентами, я регулярно выступаю с докладами и пишу статьи о машинном обучении, MLOps и прочих технологиях.

Недавно на вебинаре студент колледжа спросил меня, как я начал работать с ML и как лучше всего практиковать концепции, связанные с ML. Я сделал небольшую паузу и задумался о своем путешествии в мир машинного обучения. Я всегда чему-то учился, делая и глядя на примеры.

Итак, для всех энтузиастов Data Science, которые ищут сквозной проект ML, я работал над созданием проекта на прошлых выходных. Вы можете получить доступ к репозиторию GitHub со всем кодом здесь.

Код проведет вас через чтение необработанного набора данных для задачи классификации доходов с использованием Python, обучит на нем различные модели машинного обучения, а затем развернет лучшую модель машинного обучения в качестве конечной точки REST с помощью инфраструктуры Flask на вашем локальном компьютере. Я также использовал Bootstrap для создания простой формы для конечных пользователей, чтобы они могли вводить новые данные и делать выводы.

Преимущество использования Flask заключается в том, что это простая, но мощная структура, которая хорошо связана с частью развертывания MLOps. Фреймворк Bootstrap позволил мне добавить некоторые базовые шаблоны вокруг формы и стилизовать ее.

В будущих статьях я покажу, как можно упростить разработку и развертывание всей модели с помощью Databricks и MLflow.

Не стесняйтесь комментировать и оставлять любые отзывы.