Analiza Sieci Społecznych

Analiza Sieci Społecznych w AdvancedMiner składa się z następujących etapów:

Tworzenie sieci

Ładowanie danych

Aby rozpocząć analizę bądź wizualizację sieci należy utworzyć obiekt PhysicalData wskazujący na tabelę bazodanową, która przechowuje dane o strukturze sieci.

Każdy wiersz w tabeli odpowiada jednej krawędzi (połączeniu między węzłami) w sieci. Każdy węzeł sieci powinien mieć unikalny identyfikator. Domyślnie tworzona jest sieć skierowana. Tabela powinna zawierać dwa pola - jedno z identyfikatorem węzła będącego źródłem połączenia (source node) i drugie z identyfikatorem węzła docelowego (target node). Opcjonalnie można podać pole zawierające wagi połączenia. Domyślnie wszystkie wagi mają wartość 1.

Aby dodać obiekt PhysicalData do repozytorium metadanych należy wybrać Nowy->Physical Data... z menu kontekstowego Repozytorium Metadanych w oknie Projekty. Następnie należy wybrać alias i tabelę z bazy danych.

Dodawanie i konfiguracja SNABuildSettings

Aby dodać do repozytorium obiekt SNABuildSettings należy wybrać Nowy->Inne... z menu kontekstowego Repozytorium Metadanych. Następnie należy wybrać obiekt SNABuildSettings.

Obiekt SNABuildSettings wymaga LogicalData odnoszącego się do obiektu PhysicalData, który opisuje strukturę tabeli zawierającej dane sieci. Aby dodać LogicalData, należy wybrać Add LogicalData z menu kontekstowego obiektu SNASBuildSettings.

Następnie należy wybrać pola z identyfikatorami węzłów źródłowych (source) i węzłów docelowych (target). Dodatkowo można wskazać również pole z wartością wagi (weight) połączenia. Powyższe ustawienia wykonywane są w oknie Właściwości obiektu SNABuildSettings.

Dodawanie, konfiguracja i wykonywanie SNA build task

Aby dodać obiekt SNABuildTask do Repozytorium Metadanych należy wybrać Nowy->Task... z menu kontekstowego Repozytorium Metadanych. Następnie należy wybrać obiekt SNABuildTask.

Obiekt SNABuildTask wymaga

  • obiektu PhysicalData wskazującgo tabelę z opisem połączeń sieci,
  • obiektu SNABuildSettings,
  • obiektu Network, który będzie użyty do przechowywania sieci w formacie odpowiednim do dalszej analizy lub wizualizacji.

Dodawanie PhysicalData Aby dodać PhysicalData należy wybrać Dodaj->physicalData z menu kontekstowego obiektu SNABuildTask i wybierać obiekt PhysicalData wskazujący na tabelę z danymi o połączeniach sieci.

Dodawanie SNABuildSettings Aby dodać SNABuildSettings należy wybrać Dodaj->settings z menu kontekstowego obiektu SNABuildTask oraz wybrać obiekt SNABuildSettings.

Dodawanie obiektu Network Aby dodać Network należy wybrać Dodaj->network z menu kontekstowego obiektu SNABuildTask oraz podać nazwę obiektu, który będzie przechowywał sieć.

Aby utworzyć sieć, należy uruchomić obiekt SNABuildTask.

Filtrowanie sieci

W pewnych wypadkach koniecznym może okazać się filtrowanie sieci tak, aby otrzymać sieć mniejszych rozmiarów. Moduł SNA w AdvancedMiner zapewnia mechanizm filtrowania sieci zaprojektowany z myślą o tym zadaniu.

Aby wykonać filtrowanie sieci wymagana jest tabela bazodanowa. Każdy rekord tej tabeli opisuje jednen węzeł sieci wejściowej. W tabeli tej musi być pole z numerem węzła. Należy używać tych samych numerów węzłów, które były używane do budowy sieci. Filtrowanie jest oparte na warunku logicznym, który jest sprawdzany dla każdego węzła sieci. Warunek ten wykorzystuje atrybuty zawarte w tabeli.

Ładowanie danych

Dane do filtrowania dostarczne sa za pomocą obiektu PhysicalData.

Aby dodać obiekt PhysicalData do repozytorium Metadanych, należy wybrać: Nowy->Physical Data... z menu kontekstowego Repozytorium Metadanych w oknie Projekty. Następnie należy wybrać alias i tabelę bazy danych.

Dodawanie i konfiguracja SNA filter settings

Aby dodać obiekt SNAFilterSettings do Repozytorium Metadanych należy wybrać Nowy->Inne... z menu kontekstowego Repozytorium Metadanych. Następnie należy wybrać obiekt SNAFilterSettings.

Obiekt SNAFilterSettings wymaga obiektu LogicalData wskazującego na obiekt PhysicalData oparty na tabeli z danymi o węzłach sieci. Aby dodać obiekt LogicalData należy wybrać Add LogicalData z menu kontekstowego obiektu SNAFilterSettings.

Następnie należy otworzyć attributeUsageSet związany z obiektem SNAFilterSettings i wybrać pole NODE ID, które będzie wykorzystane do filtrowania. Można również wybrać wskazać inne typy atrybutów dla pól w tabeli. Typ atrybutu określa rodzaj kryterium filtrowania jakie będzie na nim oparte.

Kolejnym krokiem jest podanie warunku filtrowania w polu Filter w oknie Właściwości obiektu SNAFilterSettings.

Szczegóły dotyczące sposobu konfigurowania obiektu SNAFilterSettings można znaleźć w części dokumentacji Filtrowanie sieci / Użycie.

Dodawanie, konfigurowanie i uruchamianie zadania filtrowania SNA

Aby dodać obiekt SNAFilterTask do Repozytorium Metadanych należy wybrać Nowe->Zadanie... z menu kontekstowego Repozytorium Metadanych. Następnie należy wybrać obiekt SNAFilterTask.

Obiekt SNAFilterTask wymaga następujących elementów:

  • obiektu Network, w którym przechowywana jest sieć wejściowa,
  • obiektu outputNetwork, w którym przechowywana jest podsieć po filtrowaniu,
  • obiektu SNAFilterSettings.

Opcjonalnie można dodać następujące elementy:

  • obiekt PhysicalData wskazujący na tabelę do przechowywania odfiltrowanych rekordów z tabeli wejściowej,
  • obiekt PhysicalData wskazujący na tabelę do przechowywania danych o połączeniach po odfiltrowaniu.

Po prawidłowym zdefiniowaniu obiektu SNAFilterTask można go uruchomić. Zostanie wówczas utworzona podsieć będąca wynikiem filtrowania i tabele wynikowe.

Analizowanie sieci

Analiza sieci jest główną częścią pracy z sieciami społecznymi w AdvancedMiner. Moduł SNA oferuje wiele algorytmów służących analizie sąsiedztwa pojedynczych węzłów, ich społeczności oraz sieci jako całości.

Dodawanie i konfigurowanie SNA settings

Obiekt SNASettings jest używany do konfiguracji wszystkich algorytmów służących analizie sieci.

Aby dodać obiekt SNASettings do Repozytorium Metadanych należy wybrać Nowy->Inne... z menu kontekstowego Repozytorium Metadanych. Następnie należy wybrać obiekt SNASettings i podać nazwę obiektu, który należy utworzyć.

Obiekt SNASettings może być skonfigurowany z obiektem LogicalData, który reprezentuje tabelę z danymi używanymi do analiz oraz zestawem algorytmów analizy.

Aby dodać algorytm, należy wybrać Add element z menu kontekstowego algorithms i wskazać algorytm. Można wybrać wiele algorytmów. Można również dodać wiele algorytmów tego samego rodzaju, z różnymi ustawieniami parametrów.

Każdy algorytm ma swoje wymagania. W rozdziale Moduł SNA, w części Opis metody i Użycie / Analiza sieci można znaleźć szczegółowe informacje na temat dostępnych algorytmów i sposobu ich konfiguracji.

Dodawanie, konfiguracja i wykonywanie zadań SNA

Obiekt SNATaskjest odpowiedzialny za wykonanie zadań analizy sieci odpowiadających ustawieniom obiektu SNASettings.

Aby dodać do Repozytorium Metadanych obiekt SNATask należy wybrać Nowy->Task... Z menu kontekstowego Repozytorium Metadanych. Następnie należy wybrać obiekt SNATask.

Obiekt SNATask wymaga następujących elementów:

  • obiektu Network, który przechowuje siec wejściową,
  • obiektu SNASettings,
  • obiektu PhysicalData wskazującego tabelę bazodanową, w której przechowywane są wyniki analizy.

Dodatkowo można również dodać:

  • obiekt PhysicalData wskazujący tabelę z zawierającą dane o węzłach sieci.

Wizualizacja Sieci

Tworzenie i konfiguracja wizualizacji

W celu stworzenia wizualizacji sieci należy upewnić się, że odpowiedni obiekt Network jest załadowany. Następnie należy wybrać Create visualization z menu kontekstowego obiektu Network. W Repozytorium Metadanych pojawią się dwa obiekty: VisualizationTask i VisualizationStatiscs.

Funkcjonalność wizualizacji nie ogranicza się tylko do przedstawienia sieci. Można prezentować również różne rodzaje zmiennych i statystyki związane z węzłami sieci lub podsieciami, jak na przykład społeczności, role lub inne zmienne nominalne lub numeryczne. W celu zaprezentowania dodatkowych informacji, do obiektu VisualizationTask należy dodać atrybuty zawarte w dodatkowych tabelach. Rekordy z tych tabel powinny odpowiadać węzłom sieci. Każda tabela powinna zawierać pole, w którym jest numer węzła sieci. Należy użyć tych samych numerów węzłów, jakie zostały użyte w zadaniu budowy sieci.

Aby dodać dane do wizualizacji z dodatkowych tabel, należy wybrać Dodaj z menu kontekstowego Attributes będącego elementem obiektu NetworkVisualtion. Zostanie otwarte okno dialogowe, w którym można wybrać alias bazy danych, tabelę, pole z numerami węzłów sieci oraz typy zmiennych w tabeli.

Praca z wizualizacją

Aby otworzyć wizualizację, należy załadować i otworzyć obiekt VisualizationTask, który został utworzony w repozytorium, klikając na niego dwukrotnie.

  • Wygląd grafu reprezentującego sieć może być zmieniany przy pomocy suwaków dostępnych na dole okna.
  • Pasek narzędzi na górze okna wizualizacji zawiera przyciski dające możliwość filtrowania węzłów, dodawania danych uzupełniających, uruchamiania narzędzia Freq i wykonania zrzutu ekranu z okna wizualizacji.
  • Zawartość wizualizacji może być kontrolowana przy użyciu komponentu Nawigator

Dostosowanie zawartości wizualizacji

Dostosowanie rozmieszczenia.  Aby dostosować rozmieszczenie węzłów, należy wybrać zakładkę Layout w oknie Nawigatora. Dostępne są trzy możliwe sposoby rozmieszczenia: ForceDirected, OpenOrd and Random. Aby zastosować konkretny sposób rozmieszczenia należy wybrać odpowiednią opcję, ustawić dostępne parametry i kliknąć przycisk Run.

Podział sieci.  Aby ustawić podział sieci należy wybrać zakładkę Partition w oknie nawigatora. Sieć może być podzielona zgodnie z wartościami zmiennych nominalnych lub zmiennych całkowitoliczbowych. Węzły z różnymi wartościami zmiennych nominalnych są prezentowane w różnych kolorach. Aby zastosować podział należy wybrać atrybut i uruchomić przetwarzanie przyciskiem Run.

Ranking węzłów.  Istnieje możliwość wizualizacji dodatkowych numerycznych atrybutów węzłów. Wartości tych atrybutów można przedstawić za pomocą wielkości węzłów lub ich kolorów. Można również dopasować stopień nasycenia kolorami odpowiadający poszczególnym wartościom atrybutów przez zmianę kształtu krzywej kolorów. Aby zwizualizować dodatkowe atrybuty węzłów należy wybrać wartość w polu Attribute, ustawić krzywą nasycenia kolorów węzłów i (w przypadku rankingu kolorów) wybrać kolory odpowiadające minimalnym i maksymalnym wartościom zmiennych. Następnie należy uruchomić przetwarzanie za pomocą przycisku Run.

Dodawanie etykiet.  Do wizualizacji sieci można dodać etykiety z wartościami wybranych atrybutów sieci. Aby pokazać etykiety należy wybrać zakładkę Partition w oknie nawigatora, w polu Attribute wskazać wybraną zmienną, dostosować wielkość etykiety i uruchomić przetwarzanie za pomocą przycisku Run.