Zadania kontrolne

  1. Wczytać zbiór uczący iris i dokonać jego podziału na część uczącą i testową (po 75 próbek dla uczenia i testowania)
  2. Skonstruować drzewo klasyfikacyjne dla domyślnych wartości parametrów na podstawie zbioru uczącego i dokonać jego wizualizacji
  3. Ocenić uzyskaną sprawność klasyfikacji na zbiorze testowym. Ile elementów zostało niepoprawnie zaklasyfikowanych?
  4. Odczytać wartości parametrów drzewa klasyfikacyjnego. Jakie kryterium decyduje o wyborze testu dla wartości atrybutów?
  5. Przetestować działanie algorytmu drzewa klasyfikacyjnego na próbkach zbioru testowego i ocenić sprawność klasyfikacji.
  6. Skonstruować i wyświetlić drzewo ponownie ograniczając jego głębokość do dwóch oraz trzech. Jaką w tym przypadku osiągamy sprawność klasyfikacji?
  7. Skonstruować drzewo klasyfikacyjne korzystając z kryterium przyrostu informacji dla wyboru testu (Wskazówka: criterion=’entropy’).
  8. Przetestować uzyskane drzewo na zbiorze testowym i porównać wynik z drzewem uzyskanym dla indeksu Giniego.
  9. Skonstruować drzewa klasyfikacyjne korzystając z innych parametrów determinujących jego strukturę takich jak minimalna liczba próbek uczących w liściu drzewa min_samples_leaf, maksymalna dopuszczalna liczba liści drzewa (max_leaf_nodes).
  10. Skonstruować drzewo klasyfikacyjne dla zbioru iris w podprzestrzeni cech złożonej jedynie z dwóch pierwszych atrybutów. Ocenić sprawność uzyskanego rozwiązania.
Następna część - Metody redukcji wymiarowości przestrzeni cech