PhysicalData (PD) jest obiektem zawierającym informacje o danych użytych w określonym procesie Data Mining. PD przechowuje informacje o lokalizacji danych (plik csv, tabela bazodanowa ...), ich typie (integer/double/string/notSpecified) oraz pewne podstawowe statystyki (liczbę wartości brakujących, średnią...). PhysicalData może być wykorzystana zarówno jako dane źródłowe (na przykład dla zadania budowy modelu) a także jako dane wynikowe (przy stosowaniu modelu na danych).
Tabela 4.4. Obiekty powiązane
Status | Nazwa | Opis | Typ | Referencja |
---|---|---|---|---|
included | alias | zawiera informacje o aliasie bazy, z której wybrano dane | Database Alias | own |
included | attributes | zawiera szereg statystyk dla każdej zmiennej osobno; statystyki zostają doliczone dopiero w skutek wykonania innych tasków, np.: CalculateStatiscticsTask, BuildingModel | Elements | own |
included | statistics | obiekt odpowiedzialny za przechowywanie statystyk | Statistics | own |