Результаты (
русский) 3:
[копия]Скопировано!
В настоящем документе, мы с новаторской концепцией группыобразное, основанное на связи между точками данных, вместо расстояния на базе Lp 3 метрических или J accard коэффициента. Для доменов с дискретной нечисловых наблагодарностей, непригодность Lp расстояние метрики и J accard коэффициент оценка sim-ilarity между кластерами видно из примера 1.1 . и 1.2 .Ситуация с этим расстояние метрики меха ежедневныекашель, количество атрибутов/размеры увеличения.
Понятие связей между точками данных помогает нам преодолеть проблемы с Lp расстояния и JACкарта коэффициента. Позвольте пару моментов быть соседей, если их схожести превышает определенное пороговое значение. SIM-ilarity значение для пары точек может быть основана на Lp расстояния,В Jaccard коэффициент или любые другиеметрических функций сходства получить домен exморской технический комитет Морского ведомства/ сходство. Количество связей между пары точек, а затем число общих соседей для точек. Точек, принадлежащих к одной группе в целом имеют большое число общих соседей, и следовательно, более ссылки. Таким образом, в ходе кластеризации,Слияния кластеров и точек с наиболее число каналов первый приведет к более и более значимые кластеры.
Конкретно, в примере 1.1 , предположим, что мы определены пары сделок, которые могут быть соседей, если они содержат по крайней мере один элемент общего. В этом случае, сделки { 1, 4} и { 6} не будет иметь никаких связей между ними и, таким образом, не будут объединены. Аналогичным образом, в примере 1.2 ,Мы можем показать, что ссылки, более уместным, чем distances для кластеризации категорическое наборов данных (см. раздел 3.2 ).
переводится, пожалуйста, подождите..