Zadania kontrolne
- Wczytać zbiór uczący iris i dokonać jego podziału na część uczącą i testową (po 75 próbek dla uczenia i testowania)
- Skonstruować drzewo klasyfikacyjne dla domyślnych wartości parametrów na podstawie zbioru uczącego i dokonać jego wizualizacji
- Ocenić uzyskaną sprawność klasyfikacji na zbiorze testowym. Ile elementów zostało niepoprawnie zaklasyfikowanych?
- Odczytać wartości parametrów drzewa klasyfikacyjnego. Jakie kryterium decyduje o wyborze testu dla wartości atrybutów?
- Przetestować działanie algorytmu drzewa klasyfikacyjnego na próbkach zbioru testowego i ocenić sprawność klasyfikacji.
- Skonstruować i wyświetlić drzewo ponownie ograniczając jego głębokość do dwóch oraz trzech. Jaką w tym przypadku osiągamy sprawność klasyfikacji?
- Skonstruować drzewo klasyfikacyjne korzystając z kryterium przyrostu informacji dla wyboru testu (Wskazówka: criterion=’entropy’).
- Przetestować uzyskane drzewo na zbiorze testowym i porównać wynik z drzewem uzyskanym dla indeksu Giniego.
- Skonstruować drzewa klasyfikacyjne korzystając z innych parametrów determinujących jego strukturę takich jak minimalna liczba próbek uczących w liściu drzewa min_samples_leaf, maksymalna dopuszczalna liczba liści drzewa (max_leaf_nodes).
- Skonstruować drzewo klasyfikacyjne dla zbioru iris w podprzestrzeni cech złożonej jedynie z dwóch pierwszych atrybutów. Ocenić sprawność uzyskanego rozwiązania.
Następna część - Metody redukcji wymiarowości przestrzeni cech