Результаты (
русский) 2:
[копия]Скопировано!
2 Связанные работы
кластеров была тщательно изучена исследователями в психологии, статистики, биологии и так далее. Обзоры алгоритмов кластеризации могут быть найдены в [DH73, JD88]. Совсем недавно, кластеризации алгоритмы для горнодобывающей больших баз данных были предложены в [NH94, ZRL96, EKSX96, GRS98]. Большинство из них, однако, варианты либо partitional (например, [NH94]) или центра тяжести на основе иерархической кластеризации (например, [ZRL96, GRS98]). В результате, как отмечалось в разделе 1.1, эти алгоритмы являются более подходящими для кластеризации числовые данные, а не наборы данных с категорическими атрибутов.
В последнее время в [HKKM97], авторы решения проблемы кластеризации, связанных клиентских операций в базе данных потребительской корзины , Часто встречающихся наборов, используемых для генерации ассоциативные правила используются для построения взвешенной гиперграфа. Каждый часто НИКАКИХ гарантий является гиперребро в весовом гиперграфа и вес гиперребро вычисляется как среднее из признаний для всех возможных ассоциативных правил, которые могут быть получены от НИКАКИХ гарантий. Затем алгоритм Гиперграф перегородки из используется для разделения элементов, таких, что сумма весов гиперребер, нарезаемых из-за разделения сведена к минимуму. Результат кластеризации элементов (не операции), которые происходят вместе в сделках. Наконец, пункт кластеры используются как описание кластера и забил метрика используется для назначения операции клиентов в лучшем пункт кластера.
Обоснованием для использования за товаром кластеров в кластер сделки находится под вопросом. Например, подход в [HKKM97] делает предположение, что наборов, которые определяют кластеры пересекаются и не имеют overap среди них. Это не может быть правдой на практике, поскольку сделки в разных кластерах может иметь несколько общих элементов. Рассмотрим, например, базы данных потребительской корзины в примере 1.2. При минимальной поддержке, установленным в 2 сделок, алгоритм разделения гиперграфа генерирует два товаром кластеров, один из которых является {7} и другой содержит оставшиеся пункты (с 7 имеет наименее гиперребра других предметов). Тем не менее, это приводит к сделкам {1, 2, 6} и {3, 4, 5} быть отнесен к тому же кластере, поскольку оба имеют высокий балл по отношению к большой группе элементов.
переводится, пожалуйста, подождите..
