Spis treści
Freq jest komponentem służącym do eskploracji danych "w locie" i oceny modelu za pomocą efektywnego graficznego interfejsu użytkownika. Głównymi zaletami Freqa są:
Freq jest komponentem graficznym odpowiadającym obiektowi calculateStatisticsTask w repozytorium metadanych.
Freq może być uruchomiony bezpośrednio z poziomu interfejsu użytkownika AdvancedMiner lub przez utworzenie obiektu CalculateStatisticsTask z poziomu skryptu lub ręcznie i otworzenie go.
Aby utworzyć obiekt Freqa z poziomu interfejsu użytkownika należy:
W następstwie tej akcji otwarte zostanie nowe okno z widokiem komponentu tableName_pd_stats.
w każdym z opisanych powyżej przypadków w repozytorium metadanych zostaną utworzone następujące obiekty:
Jeżeli obiekt calculateStatisticsTask dla danej tabeli już istnieje, możliwe jest również otworzenie go w taki sam sposób, jak przy tworzeniu nowego Freqa, z menu kontekstowego wybierając
-> .Aby utworzyć obiekt calculateStatisticstask, należy:
Następnie należy otworzyć nowoutworzony obiekt CalculateStatisticsTask aby otworzyć komponent Freq. Alternatywnie, można wybrać
-> z menu kontekstowego tabeli w komponencie Services, explorerze bazy danych albo w komponencie odpowiadającym za widok tabeli.Możliwe jest również automatycznie utworzenie obiektów physicalData i CalculateStatisticsTask za pomocą skyrptu w Gythonie. Ilustruje to przykład poniżej.
Przykład 12.1. Calculate statistics task:
if not tableExists('german_credit'): raise "Table 'german_credit' does not exists. Please run german_credit.py script from data directory first" # create and save physical data pd = PhysicalData('german_credit') save('pd', pd) # create calculate statistics object cst=CalculateStatisticsTask() # set physical data cst.setPhysicalDataName('pd') # statistics will be calculated for 'Class' attribute cst.getStatisticsSettings().addAttribute("Class") save('cst', cst) execute('cst') # load discrete statistics for 'Class' attribute discVal = load('pd').getAttribute("Class").getAttributeStatistics().getDiscreteStatistics() print "Modal:",discVal.getModal() print "Maximal values count:",discVal.getMaxValuesCount() print "Number of discrete values:",discVal.getNumberOfDiscreteValues() # print value and frequency strFormat = "%-30s%-4s" print strFormat % ("Value", "Frequency") for item in discVal.getDiscreteValues(): print strFormat % (item,discVal.getValueCount(item))
Output:
Modal: good Maximal values count: 100 Number of discrete values: 2 Value Frequency good 700 bad 300
Komponent Freq składa się z paska z narzędziami oraz przewijanej listy pól z atrybutami, w których wyświetlone są histogramy, tabele wartości zmiennej i inne statystyki. Rysunek poniżej przedstawia elementy interfejsu graficznego Freqa.
Zależnie od tego, w jaki sposób Freq został utworzony, statystyki dla niektórych atrybutów mogą być wyliczone lub nie. Por. sekcję Wyliczanie atrybutów.
Kolejność, w jakiej wyświetlane są atrybuty, może byc zmienione przy użyciu listy rozwijalnej Sort By na pasku z narzędziami Freqa.