Аффинитивный анализ (affinity analysis)


Аффинитивный анализ (affinity analysis) — один из распространенных методов  Его название происходит от английского слова affinity, которое в переводе означает «близость», «сходство». Цель данного метода — исследование взаимной связи между событиями, которые
происходят совместно. Разновидностью аффинитивного анализа является анализ рыночной корзины (market basket analysis), цель которого — обнаружить ассоциации между различными событиями, то есть найти правила для количественного описания взаимной связи между двумя
или более событиями. Такие правила называются ассоциативными правилами (association rules). Примерами приложения ассоциативных правил могут быть следующие задачи:
§ выявление наборов товаров, которые в супермаркетах часто покупаются вместе или никогда не покупаются вместе;
§ определение доли клиентов, положительно относящихся к нововведениям в их обслуживании;
§ определение профиля посетителей веб-ресурса;
§ определение доли случаев, в которых новое лекарство показывает опасный побочный эффект.

Базовым понятием в теории ассоциативных правил является транзакция — некоторое множество событий, происходящих совместно. Типичная транзакция —приобретение клиентом товара в супермаркете. В подавляющем большинстве случаев клиент покупает не один товар, а
набор товаров, который называется рыночной корзиной. При этом возникает вопрос: является ли покупка одного товара в корзине следствием или причиной покупки другого товара, то есть связаны ли данные события? Эту связь и устанавливают ассоциативные правила.

Например, может быть обнаружено ассоциативное правило, утверждающее, что клиент, купивший молоко, с вероятностью 75 % купит и хлеб. Следующее важное понятие — предметный набор. Это непустое множество предметов, появившихся в одной транзакции. Анализ рыночной корзины — это анализ наборов данных для определения комбинаций
товаров, связанных между собой. Иными словами, производится поиск товаров, присутствие которых в транзакции влияет на вероятность наличия других товаров или комбинаций товаров. Современные кассовые аппараты в супермаркетах позволяют собирать информацию о покупках, которая может храниться в базе данных. Затем накопленные данные могут
использоваться для построения систем поиска ассоциативных правил.