Zadania kontrolne

  1. Wczytać zbiór olivetti faces. Dla liczby komponentów od 1 do 6 przeprowadzić algorytmem PCA redukcję przestrzeni wymiaru cech. Zobrazować wyniki. Dla jakiej liczby komponentów uzyskano najlepszy wynik?
  2. Korzystając z funkcji sklearn.datasets.fetch_mldata pobierz zbiór danych MNIST. Zbiór ten zawiera zdigitalizowane próbki ręczne pisma cyfr od 0 do 9. Podziel zbiór losowo na część uczącą i testową.
  3. Korzystając z algorytmu FLD dokonaj redukcji wymiaru cech dla różnej liczby cech zbioru uczącego MNIST. Następnie sprawdź sprawność klasyfikatora kNN dla zbioru testowego ograniczonego do wybranego podzbioru cech. Parametr \(k\) przyjmij jako pierwiastek z liczby obiektów w zbiorze. Dla jakiej liczby cech osiągnięto najlepsze rezultaty?
  4. Korzystając z algorytmu PLS dokonaj redukcji wymiaru cech dla różnej liczby cech zbioru uczącego MNIST. Następnie sprawdź sprawność klasyfikatora kNN dla zbioru testowego ograniczonego do wybranego podzbioru cech. Parametr \(k\) przyjmij jako pierwiastek z liczby obiektów w zbiorze. Dla jakiej liczby cech osiągnięto najlepsze rezultaty?
  5. Zaimplementuj algorytm SFS.
  6. Pobierz zbiór danych Arcene ze strony https://archive.ics.uci.edu/ml/datasets/Arcene. Podziel zbiór losowo na część uczącą i testową.
  7. Dla zbioru danych Arcene dokonaj selekcji 5% cech algorytmem SFS. Jako funkcję kryterialną \(J\) przyjmij sprawność klasyfikatora kNN dla wybranego podzbioru cech. Parametr \(k\) przyjmij jako pierwiastek z liczby obiektów w zbiorze.
  8. Zaimplementuj algorytm SFFS.
  9. Dla zbioru danych Arcene dokonaj selekcji 5% cech algorytmem SFFS. Jako funkcję kryterialną \(J\) przyjmij sprawność klasyfikatora kNN dla wybranego podzbioru cech. Parametr \(k\) przyjmij jako pierwiastek z liczby obiektów w zbiorze. Powtórz ekspertyment dla innej liczby cech np. dla 1, 2, 5, 10, 15, 20, 50, 100 cech. W którym przypadku otrzymano najlepsze wyniki.
  10. Dla zbioru danych Arcene dokonaj selekcji 5% cech algorytmem SBS. Jako funkcję kryterialną \(J\) przyjmij sprawność klasyfikatora kNN dla wybranego podzbioru cech. Parametr \(k\) przyjmij jako pierwiastek z liczby obiektów w zbiorze. Powtórz ekspertyment dla innej liczby cech np. dla 1, 2, 5, 10, 15, 20, 50, 100 cech. W którym przypadku otrzymano najlepsze wyniki.
  11. Zaimplementuj algorytm SFBS.
  12. Dla zbioru danych Arcene dokonaj selekcji 5% cech algorytmem SFBS. Jako funkcję kryterialną \(J\) przyjmij sprawność klasyfikatora kNN dla wybranego podzbioru cech. Parametr \(k\) przyjmij jako pierwiastek z liczby obiektów w zbiorze. Powtórz ekspertyment dla innej liczby cech np. dla 1, 2, 5, 10, 15, 20, 50, 100 cech. W którym przypadku otrzymano najlepsze wyniki.
Następna część - Maszyny wektorów podpierających