[BIG DATA] GLOSARIUSZ (IX) : WIZUALIZACJA

Jednym z najlepszych sposobów przekazania znaczenia danych jest wyodrębnienie ważnych części i przedstawienie ich graficznie. Jest to przydatne zarówno do użytku wewnętrznego, jako technika eksploracji w celu wykrycia wzorów, które nie są oczywiste z surowych wartości, oraz jako sposób na zwięzłe przedstawienie użytkownikom końcowym zrozumiałych wyników. Ponieważ sieć przerzuciła wykresy ze statycznych obrazów na interaktywne obiekty, linie między prezentacją a eksploracją zostały zamazane. Możliwości nowego medium doprowadziły do ​​niektórych fantastycznych nowych narzędzi, które omówię w tej sekcji.

Gephi

Gephi jest aplikacją typu open source w Javie, która tworzy wizualizacje sieci z danych nieprzetworzonych i wykresów węzłowych. Jest to bardzo przydatne do zrozumienia informacji o sieciach społecznościowych; jeden z założycieli projektu został wynajęty przez LinkedIn, a Gephi jest teraz używany do wizualizacji LinkedIn. Istnieje kilka różnych algorytmów układu, z których każdy ma wiele parametrów, które można dostroić w celu uporządkowania pozycji węzłów w danych. Jeśli chcesz dokonać ręcznych zmian danych wejściowych lub pozycjonowania, możesz to zrobić za pomocą laboratorium danych, a gdy już masz podstawowy wykres, karta podglądu pozwala dostosować dokładny wygląd renderowanego wyniku. Chociaż Gephi jest najbardziej znany ze swojego interfejsu okna, możesz również skryptować wiele jego funkcji za pomocą zautomatyzowanych narzędzi backendu, korzystając z biblioteki narzędziowej.

GraphViz

GraphViz to narzędzie do wizualizacji wykresów sieciowych w wierszu poleceń. Jest głównie używany ogólny schemat blokowy i schematy drzewa, a nie mniej ustrukturyzowane wykresy, z których znany jest Gephi. Powoduje również domyślnie stosunkowo brzydkie wyniki, ale istnieją opcje, aby poprawić czcionki, renderowanie linii i cienie. Pomimo tych kosmetycznych wad, GraphViz wciąż jest bardzo potężnym narzędziem do tworzenia diagramów z danych. Specyfikacja pliku DOT została przyjęta jako format wymiany przez wiele programów, co ułatwia podłączenie do wielu narzędzi i ma zaawansowane algorytmy rozmieszczania nawet ogromnej liczby węzłów.

Processing

Początkowo znany jako język programowania graficznego do tworzenia interaktywnych wizualizacji internetowych. Zgromadził bogaty ekosystem bibliotek, przykładów i dokumentacji, więc możesz znaleźć istniejący szablon dla rodzaju wyświetlania informacji potrzebnych do twoich danych.

Protovis

Protovis to framework JavaScript pełen gotowych do użycia komponentów wizualizacyjnych, takich jak wykresy słupkowe i liniowe, ukierunkowane na siłę układy sieci i inne typowe elementy składowe. Jest świetny jako interfejs wysokiego poziomu do zestawu narzędzi do istniejących szablonów wizualizacyjnych, ale w porównaniu do przetwarzania nie jest łatwo zbudować zupełnie nowe komponenty. Jego twórcy ogłosili niedawno, że Protovis nie będzie już aktywnie rozwijany, ponieważ koncentrują swoje wysiłki na bibliotece D3, która oferuje podobną funkcjonalność, ale w stylu mocno pod wpływem nowej generacji frameworków JavaScript, takich jak jQuery.

Fusion Table

Google stworzył zintegrowany system online, który pozwala przechowywać duże ilości dane w tabelach podobnych do arkuszy kalkulacyjnych i udostępnia narzędzia do przetwarzania i wizualizacji informacji. Jest to szczególnie dobre w przekształcaniu danych geograficznych w atrakcyjne mapy, z możliwością przesyłania własnych niestandardowych konturów KML dla obszarów takich jak okręgi polityczne. Dostępny jest również pełen zestaw tradycyjnych narzędzi do tworzenia wykresów, a także wiele różnych opcji do wykonywania obliczeń na danych. Fusion Tables to potężny system, ale zdecydowanie przeznaczony dla użytkowników dość technicznych; sama różnorodność formantów może na początku być zastraszająca. Jeśli szukasz elastycznego narzędzia do rozpoznawania dużych ilości danych, warto podjąć wysiłek.

Tableau

Pierwotnie tradycyjna aplikacja komputerowa do rysowania wykresów i wizualizacji, Tableau dodała wiele wsparcia dla publikacji online i tworzenia treści. Osadzone wykresy stały się bardzo popularne wśród organizacji prasowych w Internecie, ilustrując wiele historii. Obsługa danych geograficznych nie jest tak szeroka, jak obsługa Fusion, ale Tableau może tworzyć style map, których nie może wyprodukować produkt Google. Jeśli potrzebujesz zaawansowanych funkcji interfejsu pulpitu lub koncentrujesz się na tworzeniu grafiki do profesjonalnej publikacji, Tableau to dobry wybór.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *