Zadania kontrolne

  1. Wygenerować zbiór danych za pomocą poniższego polecenia:

    mk_data=make_classification(n_samples=30, n_features=3, n_informative=3,

    n_redundant=0, n_repeated=0, n_classes=4,

    n_clusters_per_class=1, class_sep=3)

    Przypisać do odpowiednich zmiennych macierz danych oraz założone etykiety klasowe

  2. Przeprowadzić grupowanie hierarchiczne z miarą najbliższego oraz najdalszego sąsiada.

  3. Przebieg grupowania hierarchicznego z poprzedniego punktu zilustrować dendrogramem.

  4. Odciąć dendrogram na poziomie 4 i zwrócić uzyskane podziały, porównać je ze sobą za pomocą macierzy konfuzji.

  5. Uzyskane podziały porównać za pomocą macierzy konfuzji

  6. Porównać obydwa wyniki z założoną strukturą klasową za pomocą indeksu Randa oraz Jaccarda. Który z podziałów jest bliższy założonemu?

  7. Wczytać zbiór danych digits. Przeprowadzić grupowanie za pomocą algorytmu k średnich w zakresie 2-20 grup.

  8. Zaproponować funkcję obliczającą indeks Dunna zbioru danych dla wskazanego podziału.

  9. Ocenić podziały zbioru digits uzyskane w punkcie 7 za pomocą indeksu Dunna i oszacować optymalną liczbę grup.

  10. Za pomocą indeksu Dunna ocenić liczbę grup w zbiorze z punktu 1 na podstawie podziałów zwracanych przez algorytm k-średnich.

Następna część - Sztuczne sieci neuronowe