Публикации по теме 'r'


Прогнозирование популярности комментариев The New York Times (часть 1)
Всем привет! Я только что закончил свой главный проект по получению сертификата больших данных от Университета Райерсона в Торонто. Этот проект был довольно сложным, но требовал огромных знаний. Я потратил почти месяц на ее окончательную доработку и подготовку отчета. Следуйте подробному пошаговому коду R на моем GitHub . В первой части мы поговорим о постановке проблемы и познакомим вас с набором данных и различными визуализациями, которые я придумал для лучшего понимания..

Возвращение к регрессу большого магазина продаж: войдите в tidymodels
Вводный проект регрессии машинного обучения с использованием Tidymodels Tidymodels - это метапакет, очень похожий на tidyverse, который загружает в ваш сеанс массив полезных пакетов tidy. Разница в том, что он загружает серию пакетов, используемых в процессе разработки модели машинного обучения. Я расскажу о каждом из них по мере их использования и представлю практический пример использования. Tidymodels был разработан Максом Куном, которого привлекла RStudio для разработки удобных и..

Небольшие данные, большая ценность
Как простые и быстрые проекты машинного обучения могут превзойти огромные инвестиции в технологии (Не любите читать? Перейдите сразу к демонстрации и протестируйте модель самостоятельно!) Этот пост написан в соавторстве с Джоэлом Верделлом, главным менеджером по продукту в T-Mobile. Журналистика машинного обучения сосредоточена исключительно на масштабных усилиях: гигантские наборы данных загружаются в интенсивные вычислительные машины и месяцы работы для получения..

# 1: Расчет общих расходов с больничными расходами в компании
# 1: Расчет общих расходов с больничными расходами в компании Все данные и контекст ниже являются вымышленными. Представьте, что вы владелец или несете ответственность за расходы компании. И вам нужно рассчитать общие затраты на больничные расходы с новыми 20 сотрудниками. Я использую язык R и Studio R в качестве IDE. И чтобы решить эту проблему, мы создадим модель машинного обучения, используя алгоритм линейной модели. В компании есть данные (назовем «расходы») по текущим..


Изучение недоедания: часть 6 - Область исследований 3: удивительные тенденции
Исследовательский проект визуального исследования данных для лучшего понимания нюансов нашего глобального питания СОДЕРЖАНИЕ Это часть 6 исследовательского проекта, состоящего из 8 частей, цель которого - лучше понять нюансы нашего глобального питания. Он исследует эту тему с помощью методов визуализации данных и науки о данных. Он дополняется веб-приложением ExploringUndernourishment , которое свободно доступно для всех. Часть 1 - Введение и обзор Часть 2 - Обзор..

Не используйте R в продакшене
Но если вы это сделаете, вот как Мы используем R в производственной среде уже несколько лет, и этот пост посвящен тому, как это сделать. Этот пост также о том, почему я до сих пор не думаю, что вам следует запускать R в продакшене, если он вам на самом деле не нужен. Я смотрю на это с точки зрения инженера. Мы поговорим о лицензировании, ограничениях R и о том, как решить основные препятствия, чтобы добраться до точки, где вы можете запускать Rscripts в продакшене с гораздо меньшими..