Rozdział 10. Kod scoringowy w AdvancedMiner

Spis treści

Wprowadzenie
Kod scoringowy dla modeli
Wymagania
Tworzenie kodu scoringowego w Java opartego na modelu krok po kroku
Architektura kodu scoringowego w Java
Wykonywanie kodu scoringowego dla modelu
Różnice w kodzie scoringowym dla różnych modeli
Wykonywanie kodu scoringowego poza systemem AdvancedMiner
Czytanie InputSignature
Przykład wykorzystania kodu scoringowego w zewnętrznej aplikacji

Wprowadzenie

Dział bezpieczeństwa w korporacji zazwyczaj uniemożliwia włączenie oprogramowania firm trzecich z nieznanego kodu źródłowego do podstawowego systemu. Takie oprogramowanie nie może być uznane za w pełni bezpieczne i wystarczająco skuteczne. Bardziej praktyczne i bezpieczne jest generowanie kodu źródłowego, który może być używany bez oprogramowania Data Mining. Taki kawałek kodu jest dużo łatwiejszy do analizy niż weryfikacja całego oprogramowania Data Mining. Ten rodzaj źródłowego kodu nazywa się kodem scoringowym.

AdvancedMiner zapewnia generowanie kodu scoringowego dla modeli Data Mining i transformacji danych. AdvancedMiner generuje kod scoringowy w języku programowania Java oraz do innych języków programowania.

Wygenerowany kod jest kodem samodzielnym, tzn. nie wymaga AdvancedMiner i jego bibliotek do pracy. W rzeczywistości kompilacja i wykonanie kodu daje takie same wyniki jak w przypadku realizacji Apply Task w AdvancedMiner. Kod scoringowy zawiera tylko kod instrukcji przetwarzania danych i generowania wyników modelu. Dane muszą zostać dostarczone przez programistę tzn. musi on podać odpowiednie nazwy zbiorów jako parametry kodu.

Kod scoringowy pozwala programiście ręcznie modyfikować:

  • przypisać atrybuty wejściowe

  • kategoryczne atrybuty kodowania (kategoryczne atrybuty są kodowane na wartości liczbowe np. w drzew decyzyjnych)

  • nazwy zbiorów wyjściowych

  • wstępne przetwarzanie danych (transformacje)

Poniższe przykłady wymagają pewnej wiedzy o języku programowania Java..