Zadania kontrolne¶
Wygenerować zbiór danych za pomocą poniższego polecenia:
mk_data=make_classification(n_samples=30, n_features=3, n_informative=3,
n_redundant=0, n_repeated=0, n_classes=4,
n_clusters_per_class=1, class_sep=3)
Przypisać do odpowiednich zmiennych macierz danych oraz założone etykiety klasowe
Przeprowadzić grupowanie hierarchiczne z miarą najbliższego oraz najdalszego sąsiada.
Przebieg grupowania hierarchicznego z poprzedniego punktu zilustrować dendrogramem.
Odciąć dendrogram na poziomie 4 i zwrócić uzyskane podziały, porównać je ze sobą za pomocą macierzy konfuzji.
Uzyskane podziały porównać za pomocą macierzy konfuzji
Porównać obydwa wyniki z założoną strukturą klasową za pomocą indeksu Randa oraz Jaccarda. Który z podziałów jest bliższy założonemu?
Wczytać zbiór danych digits. Przeprowadzić grupowanie za pomocą algorytmu k średnich w zakresie 2-20 grup.
Zaproponować funkcję obliczającą indeks Dunna zbioru danych dla wskazanego podziału.
Ocenić podziały zbioru digits uzyskane w punkcie 7 za pomocą indeksu Dunna i oszacować optymalną liczbę grup.
Za pomocą indeksu Dunna ocenić liczbę grup w zbiorze z punktu 1 na podstawie podziałów zwracanych przez algorytm k-średnich.