Наука о данных связана с интеллектуальным анализом данных, машинным обучением и большими данными.

Интеллектуальный анализ данных — это процесс обнаружения закономерностей в больших наборах данных, включающий методы на стыке машинного обучения, статистики и систем баз данных.

Машинное обучение (ML) — это изучение компьютерных алгоритмов, которые автоматически улучшаются благодаря опыту, как подмножество искусственного интеллекта.

Алгоритмы машинного обучения строят математическую модель на основе выборочных данных, известных как данные для обучения, чтобы делать прогнозы или принимать решения без явного программирования для этого.

Алгоритмы машинного обучения используются в самых разных приложениях, таких как фильтрация электронной почты и компьютерное зрение, где сложно или невозможно разработать обычные алгоритмы для выполнения необходимых задач.

Подходы к машинному обучению традиционно делятся на три широкие категории в зависимости от характера «сигнала» или «обратной связи», доступной для системы обучения:

  • Обучение с учителем: компьютеру представляются примеры входных данных и их желаемые выходные данные, заданные учителем, и цель состоит в том, чтобы изучить общее правило, которое сопоставляет входные данные с выходными.
  • Обучение без присмотра: алгоритму обучения не присваиваются метки, что позволяет ему самостоятельно находить структуру на входе. Неконтролируемое обучение может быть самоцелью (обнаружение скрытых закономерностей в данных) или средством достижения цели (обучение признакам).
  • Обучение с подкреплением: компьютерная программа взаимодействует с динамической средой, в которой она должна выполнить определенную цель (например, управлять транспортным средством или играть в игру против противника).

Большие данные – это область, в которой рассматриваются способы анализа, систематического извлечения информации или иной обработки наборов данных, которые слишком велики или сложны для обработки традиционными приложениями обработки данных. программное обеспечение".