Статистический советник

Обнаружение кластеров или естественных групп

Используйте КЛАСТЕРНЫЙ АНАЛИЗ. Этот модуль содержит процедуры иерархической кластеризации с самыми разнообразными мерами близости и правилами объединения кластеров, метод k средних и двувходовую кластеризацию. Соответствующие процедуры содержатся в ДЕРЕВЬЯХ КЛАССИФИКАЦИИ.

В иерархической кластеризации 'объекты' объединяются друг с другом на последовательных шагах, что в итоге приводит к дереву, содержащему все объекты. Термин 'объекты' здесь соответствует наблюдениям или переменным; и те и другие могут быть кластеризованы. Итоговая древовидная диаграмма отчетливо представляет ветви или группы объектов, которые более похожи друг с другом, чем остальные. Таким образом, некоторые естественные структуры объектов могут быть отчетливо представлены в результате этого анализа.

В методе k средних исследователь заранее определяет, сколько кластеров он хочет получить, а программа постарается найти наилучшее разбиение объектов на требуемое число кластеров. В ходе вычислений предлагаются различные статистики, для того чтобы можно было определить, достигнута ли подходящая кластеризация, т.е. действительно ли элементы внутри каждого кластера похожи друг на друга более, чем элементы из разных кластеров.

При двухвходовом объединении одновременно кластеризуются и наблюдения, и переменные. Программа постарается построить кластеры с одинаковыми данными (значениями).






(c) Copyright StatSoft, Inc., 1984-1998
STATISTICA является торговой маркой StatSoft, Inc.