Пожалуйста, обратитесь к блокноту — краткая демонстрация сжатия данных с использованием библиотек Python. Здесь я использую SVD для сжатия изображения.

Можно использовать одни и те же коды для сжатия любого формата данных/всего, что может быть представлено в виде числовой матрицы.

Это связано с PCA — поскольку сжатие — это не что иное, как проецирование исходных данных на главные компоненты. Основные компоненты - это не что иное, как ортогональный набор векторов, которые объясняют наибольший разброс данных в базовом n-мерном векторном пространстве. Компоненты — это те выдающиеся направления, где вариация максимальна. Таким образом, можно выбрать первые несколько направлений с наивысшей вариацией путем подмножества собственных векторов диагональной матрицы на основе вариации (полученной в диагональной матрице).



Новички, пожалуйста, внимательно прочитайте эти источники

  1. Краткое введение — StatQuest: https://www.youtube.com/watch?v=FgakZw6K1QQ
  2. Подробно: Массачусетский технологический институт (проф. Стрэнг): https://www.youtube.com/watch?v=rYz83XPxiZo

Главная страница