Матричная факторизация для рекомендательных систем

Содержание

Введение
Что такое матричная факторизация?
Типы матричной декомпозиции
Методы факторизации матриц
1. Разложение по сингулярным значениям
2. Вероятностная матричная Факторизация
3. Неотрицательная факторизация матрицы
4. Разложение тензорной матрицы на множители

Введение

Как только мы открываем Netflix, платформа наполняется релевантными предложениями по фильмам или шоу, которые могут нам понравиться. Аналогичным образом, когда мы совершаем покупки онлайн, магазин электронной коммерции автоматически настраивает ассортимент рекомендуемых товаров в соответствии с нашими требованиями, бюджетом и предпочтениями. Нельзя отрицать, что такой персонализированный опыт помогает нам оставаться вовлеченными в работу с этими платформами, и мы склонны возвращаться к ним.

Почти каждый веб-сайт или приложение стремится улучшить наш онлайн-опыт, чтобы удержать пользователей, повысить вовлеченность, получить положительные отзывы и оставаться впереди конкурентов. Следовательно, им требуется эффективная и надежная система рекомендаций.

Будь то магазин электронной коммерции или OTT-платформа, каждый веб-сайт использует механизм рекомендаций, который не только предоставляет релевантные опции, но и рассказывает о поведении и предпочтениях пользователей.

Существует два типа рекомендательных систем:

1- Фильтрация на основе контента

2- Фильтрация на основе совместной работы

Однако в этом блоге мы поговорим о методах матричной факторизации для рекомендательных систем.

Что такое матричная факторизация?

Матричная факторизация является одним из наиболее востребованных методов рекомендаций по машинному обучению, используемых для генерации скрытых признаков при умножении двух различных объектов. Это работает как катализатор, позволяющий системе понимать цель покупки клиента, просматривать различные страницы, выбирать и ранжировать соответствующий контент или товары и рекомендовать несколько вариантов. После того, как результат соответствует требованиям, интерес преобразуется в покупку или транзакцию, и сделка завершается.

Коллаборативная фильтрация – это приложение для факторизации матриц машинного обучения, которое используется для выявления взаимосвязей между сущностями продуктов и пользователями. Основываясь на оценках пользователей приобретенных товаров, он прогнозирует, как они будут оценивать другие товары, чтобы рекомендовать пользователям соответствующие продукты.

Матричная факторизация для рекомендательных систем стала популярной после конкурса Netflix, то есть в 2006 году, когда OTT-платформа объявила денежный приз в размере 1 миллиона долларов тому, кто сможет улучшить ее среднеквадратичное значение на 10%. Netflix даже предоставляет обучающий набор данных из 100 480 507 оценок 480 189 пользователей, присвоенных 17 770 фильмам.

Типы матричной декомпозиции

Матричная декомпозиция бывает трех типов-

Разложение LU

Это относится к разложению матрицы на матрицы L и U. Здесь L – нижняя треугольная матрица, а U – верхняя треугольная матрица, обычно используемая для нахождения коэффициента линейной регрессии. Это разложение завершится неудачей, если матрица не сможет легко разложиться.

Декомпозиция QR – матрицы

Это означает разложение матрицы на Q и R. Q относится к квадратной матрице, а R – к верхней треугольной матрице. Используется для системного анализа.

Разложение по Холецки

Машинное обучение часто использует эту декомпозицию для вычисления линейных наименьших квадратов для линейной регрессии.

Мы можем использовать совместную фильтрацию с матричным разложением на множители в различных областях, таких как рекомендации и распознавание изображений. Здесь матрица, используемая в задаче, разрежена, поскольку существует вероятность того, что пользователь сможет оценить только несколько продуктов или фильмов. Его приложения включают

Уменьшение размерности, декомпозиция скрытых значений и многое другое.

Методы факторизации матриц

Существует четыре основных метода факторизации матрицы:

Разложение по сингулярным значениям
Факторизация вероятностной матрицы
Неотрицательная матричная факторизация
Разложение тензорной матрицы на множители

1. Разложение по сингулярным значениям

SVD основан на уменьшении размеров и генерирует рекомендации для пользователей высочайшего качества. Он используется для получения приближений низкого ранга в системах коллаборативной фильтрации перед вычислением окрестностей. Он также используется для поиска скрытых ассоциаций между пользователями и предметами, чтобы помочь вычислить прогнозируемую вероятность определенных предметов пользователем.

2. Вероятностная матричная Факторизация

PMF – это основанный на модели метод совместной фильтрации с матричным разложением на множители, который хорошо работает с разреженными, обширными и несбалансированными данными и линейно масштабируется для нескольких наборов данных.

3. Неотрицательная факторизация матрицы

Он вырос из анализа главных компонент. Он может автоматически извлекать важные и разреженные объекты из набора неотрицательных векторов данных. Следовательно, он обычно используется для изучения многомерных данных.

Одним из преимуществ использования метода NMF в коллаборативной фильтрации является наложение неотрицательности на неотрицательные матрицы; это уменьшает ошибки прогнозирования по сравнению с такими методами, как сингулярная декомпозиция (SVD).

Это приводит к интерпретируемой и разреженной декомпозиции. Более того, благодаря неотрицательной матричной факторизации низкого ранга пользователи могут работать со сжатыми размерными моделями, которые ускоряют эффективную статистическую классификацию, организацию данных и кластеризацию. Это приводит к столь же быстрому поиску трендов.

4. Разложение тензорной матрицы на множители

Чтобы преодолеть ограничения традиционной системы совместной фильтрации, недавно была внедрена эффективная система рекомендаций, которая учитывает многомерный характер реальных ситуаций для выработки предложений.

Следовательно, результатом является усовершенствованный алгоритм проектирования- методы тензорной факторизации. TF интегрирует контекстно-ориентированную информацию, чтобы расширить традиционную проблему факторизации двумерных матриц до n-мерного стиля той же проблемы.

Этот метод используется не только при матричном разложении на множители для рекомендаций, но и для выявления скрытых структур в данных в некоторых сценариях, таких как гиперспектральное снятие фиксации, идентификация лица и т.д. Этот мощный метод используется для создания модели на основе тензора с обширной информацией и более высокой точностью, поскольку доступно больше функций.

А вы что думаете?