Eksperymenty

Obok podstawowego typu projektu dostępny jest także projekt Experiments. Ideą takiego projektu jest podzielenie pracy analityka na kilka obszarów ułatwiających iteracyjne budowanie modelu. W projekcie Experiments wyróżnione są następujące zakresy pracy:

Projekt zapewnia iteracyjność procesu oraz umożliwa własne definiowanie zakresów pracy.

W obecnej wersji oprogramowaia dostępne są trzy rodzaje eksperymentów: Approximation, Classification i Clustering.

Projekt Experiments

Aby rozpocząć pracę z eksperymentem należy utworzyć nowy projekt poprzez wybranie z menu File polecenia New Project...i wybranie typu projektu Experiments.

Po utworzeniu nowego eksperymentu w oknie Projects pojawi się obiekt zawierający specjalne elementy służące wygodnej organizacji pracy nad modelem, obejmujące poszczególne zakresy pracy.

Rysunek 3.30. Obiekty związane w eksperymentem

Obiekty związane w eksperymentem

Węzeł Attributes symbolizuje zakres pracy z atrybutami. Dostępne zadania umożliwiają wygodną eksplorację danych poprzez komponent Freq oraz prostą selekcję zmiennych poprzez przycinanie zbioru danych do wskazanych zmiennych (active sets).

Węzeł Experiments symbolizuje zakres pracy związany z budową, modyfikacją i oceną jakości modelu. W nim będą przechowywane ustawienia oraz kolejno tworzone modele.

Węzeł files to katalog przechowujący skrypty umożliwiające inicjację oraz organizację całego procesu; węzeł ten obejmuje funkcjonalność iteracyjności procesu modelowania oraz organizacji i podziału pracy na obszary. W bieżącej wersji ma on charakter roboczy.

Uruchamianie eksperymentu

Najprostszym sposobem na inicjację wszelkich parametrów oraz zbudowanie modelu jest uruchomienie kompleksowo całego eksperymentu. Można to zrobić poprzez wybranie polecenia Execute z menu kontekstowego (lub wciśnięcie klawisza F6). W wyniku uruchomienia eksperymentu pojawią się kolejne okna pytające użytkownika o niezbędne ustawienia: repozytorium, alias, zbiory do modelowania oraz ustawienia zmiennej target. Po podaniu tych ustawień do projektu zostaną dodane tabele z danymi, a pod węzłem Experiments pojawią się niezbędne obiekty wspomagające modelowanie oraz węzęł oznaczony ikoną paczka zawierający wszystkie informacje o modelu oraz wynikach testowania.

Rysunek 3.31. Obiekty powstałe po uruchomieniu eksperymentu

Obiekty powstałe po uruchomieniu eksperymentu

Po obejrzeniu modelu i wyników testowania można zdecydować, czy jest on warty zapamiętania - czy warto zachować go w celu późniejszych analiz, czy też jest to model niesatysfakcjonujący i na pewno nie będzie brany w przyszłości pod uwagę. W pierwszym przypadku, gdy użytkownić zechce zachować model, klikając na ikonkę w górnym pasku narzędzi (lub używając skrótu klawiszowego ctrl-+), może dodać wskazaną 'paczkę' na stałe do projektu. Nazwa obiektu zmieni kolor z zielonego (oznaczającego obiekt zmodyfikowany niedodany na stałe do projektu) na czarny. W przeciwnym przypadku, gdy użytkownić oceni model jako niepotrzebny, nie musi podejmować żadnej czynności - przy ponownym uruchomieniu eksperymentu cała paczka zostanie nadpisana.

Po pierwszym wywołaniu eksperymentu użytkownik ma do dyspozycji wszystkie obiekty potrzebne do modelowania, w tym ustawienia algorytmu. Zmieniając ustawienia oraz korzystając z zadań dostępnych w Attributes można budować kolejne modele i dodawać je do projektu, tworząc własny zestaw modeli do dalszych analiz. Bieżące ustawienia eksperymentu można kontrolować w oknie Properties.

Rysunek 3.32. Parametry eksperymentu

Parametry eksperymentu

Porównywanie modeli

Po zgromadzeniu serii modeli użytkownik może porównać ich jakość. Aby to zrobić należy zaznaczyć interesujące modele i z menu kontekstowego (polecenie Context Scripts) wybrać zadanie porównania modeli. W wyniku zostanie wygenerowany raport zawierający zestawienie parametrów modeli oraz podstawowych statystyk. Ponadto w menu kontekstowym całego projektu istnieje możliwość wygenerowania zestawienia określonych miar oceny jakości modeli takich jak wykresy lift czy accuracy.

Rysunek 3.33. Przykładowe raporty z porównywania modeli

Przykładowe raporty z porównywania modeli

Słownik

Słownik (dictionary) jest kolejnym elementem eksperymentu ułatwiającym organizację pracy w systemie w sposób jak najwierniej naśladujący rzeczywistą pracę analityka. Słownik jest rodzajem notatnika, w którym analityk może zapisywać swoje uwagi i spostrzeżenia na temat poszczególnych zmiennych, dzięki czemu na każdym etapie pracy ma szybki pogląd do istotnych informacji o rozpatrywanym atrybucie.

Aby uzyskać dostęp do słownika, należy z menu Window wybrać polecenie Dictionary. Aby stworzyć notatkę dotyczącą określonej zmiennej należy otworzyć dowolny komponent zawierający listę zmiennych (np. podgląd physical data, sygnaturę lub parametry modelu, podgląd struktury tabeli itp.), wybrać zmienną, przejść do okna Dictionary i wpisać w nim komentarz (obejrzyj film). Komentarze będą widoczne za każdym razem, gdy zostanie zaznaczona nazwa określonej zmiennej.

Uwaga

Słownik zawsze związany jest z głównym projektem. Oznacza to, że aby mieć do niego dostęp, projekt (eksperyment), nad którym użytkownik aktualnie pracuje, musi być projektem głównym. Aby uczynić dany projekt projektem głównym z menu kontekstowego należy wybrać polecenie Set Main Project .