Analiza danych z wykorzystaniem SQL-a... - Opis i dane produktu
-
Zgłoś
Język SQL został stworzony jako narzędzie do przetwarzania danych. Mimo że zwykle jest używany do pracy z bazami danych, jego możliwości są o wiele większe. Poprawny kod SQL ułatwia przetwarzanie potężnych zbiorów danych z dużą szybkością. Szczególnie obiecującą perspektywą jest zastosowanie języka SQL na wielkich zbiorach danych przechowywanych w chmurze. Dzięki nieco bardziej złożonym konstrukcjom SQL analityk danych może z dużą efektywnością wydobywać z nich wiedzę.
Ta praktyczna książka jest przeznaczona dla analityków danych i danologów, którzy chcą używać SQL-a do eksploracji dużych zbiorów danych. Pokazuje zarówno popularne, jak i nieco mniej znane techniki budowania zapytań SQL, dzięki czemu możliwe staje się rozwiązywanie nawet bardzo zawiłych problemów i optymalne wykorzystanie właściwości tego języka w pracy na danych. W nowy, innowacyjny sposób przedstawiono tu takie pojęcia jak złączenia, funkcje okna, podzapytania i wyrażenia regularne. Zademonstrowano, jak łączyć różne techniki, aby szybciej osiągać cele za pomocą łatwego do zrozumienia, czytelnego kodu. Opisywany materiał został zilustrowany licznymi przykładami zapytań SQL, dzięki czemu można płynnie przejść do rozwiązywania konkretnych problemów z zakresu przetwarzania, analizy i eksploracji danych.
Najciekawsze zagadnienia:
przygotowywanie danych do analizy
analizy szeregów czasowych z wykorzystaniem SQL
analizy kohortowe do badania zachodzących zmian
analiza tekstu za pomocą zaawansowanych funkcji i operatorów SQL
wykrywanie odstających wartości
analizy eksperymentów (testy A/B)
SQL: tak wyciągniesz z danych rzetelne wnioski!
Spis treści: Przedmowa Rozdział 1. Analizy z wykorzystaniem SQL-a Czym jest analiza danych? Dlaczego SQL? Czym jest SQL? Korzyści, jakie daje SQL SQL a R lub Python SQL jako element procesu analizy danych Rodzaje baz danych i sposoby pracy z nimi Wierszowe bazy danych Kolumnowe bazy danych Inne rodzaje infrastruktury danych Podsumowanie Rozdział 2. Przygotowywanie danych do analiz Typy danych Typy danych w bazach Dane ustrukturyzowane i nieustrukturyzowane Dane ilościowe i jakościowe Dane z pierwszej, drugiej i trzeciej ręki Dane rzadkie Struktura zapytań w SQL-u Profilowanie - rozkład danych Histogramy i częstość wystąpień Binning Technika n przedziałów Profilowanie - jakość danych Wykrywanie duplikatów Deduplikacja za pomocą klauzul GROUP BY i DISTINCT Przygotowania - oczyszczanie danych Oczyszczanie danych za pomocą przekształceń w instrukcji CASE Konwersja i rzutowanie typów Radzenie sobie z wartościami null: funkcje coalesce, nullif i nvl Brakujące dane Przygotowania - kształtowanie danych Docelowe zastosowanie - analiza biznesowa, wizualizacja, obliczanie statystyk, uczenie maszynowe Tworzenie tabel przestawnych za pomocą instrukcji CASE Przywracanie struktury po przestawieniu z użyciem instrukcji UNION Funkcje pivot i unpivot Podsumowanie Rozdział 3. Analiza szeregów czasowych Operacje na datach, czasie oraz datach i czasie Zmiana strefy czasowej Konwersja formatu dat i znaczników czasu Obliczenia matematyczne na datach Obliczenia na czasie Złączanie danych z różnych źródeł Zbiór danych o sprzedaży detalicznej Analiza trendów w danych Proste trendy Porównywanie komponentów Obliczanie procentów z całości Stosowanie indeksacji do badania zmian procentowych w czasie Okna przesuwne Obliczenia na podstawie okien przesuwnych Okna przestawne w rzadkich zbiorach danych Obliczanie wartości skumulowanych Analiza danych z efektem sezonowości Porównywanie okres do okresu - rdr i mdm Porównania okres do okresu - te same miesiące z kolejnych lat Porównywanie z wieloma wcześniejszymi okresami Podsumowanie Rozdział 4. Analiza kohortowa Kohorty - przydatny model analiz Zbiór danych o członkach Kongresu Utrzymanie Kod w SQL-u do tworzenia prostej krzywej utrzymania Modyfikowanie szeregów czasowych, aby zwiększyć dokładność wyników analizy utrzymania Kohorty tworzone na podstawie szeregów czasowych Definiowanie kohort na podstawie odrębnej tabeli Jak radzić sobie z kohortami rzadkimi? Definiowanie kohort na podstawie dat innych niż początkowa Powiązane analizy kohortowe Przeżywalność Powroty (ponowne zakupy) Obliczanie skumulowanych wartości Analiza przekrojowa w kontekście analizy kohortowej Podsumowanie Rozdział 5. Analiza tekstu Po co analizować tekst za pomocą SQL-a? Czym jest analiza tekstu? Dlaczego SQL jest dobrym narzędziem do analizy tekstu? Kiedy SQL nie jest dobrym wyborem? Zbiór danych o obserwacjach UFO Cechy tekstu Parsowanie tekstu Przekształcanie tekstu Znajdowanie elementów w większych blokach tekstu Dopasowywanie symboli wieloznacznych: LIKE i ILIKE Dokładne dopasowywanie za pomocą operatorów IN i NOT IN Wyrażenia regularne Tworzenie tekstu i zmienianie jego kształtu Konkatencja Zmiana kształtu tekstu Podsumowanie Rozdział 6. Wykrywanie anomalii Możliwości i ograniczenia SQL-a w zakresie wykrywania anomalii Zbiór danych Wykrywanie wartości odstających Wyszukiwanie anomalii za pomocą sortowania Wyszukiwanie anomalii na podstawie percentyli i odchylenia standardowego Tworzenie wykresów w celu znajdowania anomalii Rodzaje anomalii Anomalne wartości Anomalne liczby wystąpień Anomalie w postaci braku danych Radzenie sobie z anomaliami Badanie anomalii Usuwanie danych Zastępowanie innymi wartościami Skalowanie Podsumowanie Rozdział 7. Analiza eksperymentów Wady i zalety analizy eksperymentów za pomocą SQL-a Zbiór danych Rodzaje eksperymentów Eksperymenty z wynikami binarnymi - test chi-kwadrat Eksperymenty z wynikami ciągłymi - test t Problemy z eksperymentami i sposoby radzenia sobie z błędami Przydział jednostek do wariantów Wartości odstające Okna czasowe Eksperymenty związane z wielokrotną ekspozycją Co robić, gdy kontrolowane eksperymenty są niemożliwe? Inne analizy Analiza "przed i po" Analiza eksperymentów naturalnych Analiza populacji w okolicy wartości progowej Podsumowanie Rozdział 8. Tworzenie złożonych zbiorów danych na potrzeby analiz Kiedy używać SQL-a do tworzenia złożonych zbiorów danych? Zalety stosowania SQL-a Kiedy używać procesu ETL? Kiedy umieszczać logikę w innych narzędziach? Porządkowanie kodu Komentarze Wielkość liter, wcięcia, nawiasy i inne sztuczki z obszaru formatowania Przechowywanie kodu Porządkowanie obliczeń Porządek przetwarzania klauzul w SQL-u Podzapytania Tabele tymczasowe Wyrażenia CTE Instrukcja grouping sets Zarządzanie wielkością zbioru danych i prywatnością Próbkowanie na podstawie wartości procentowych i dzielenia modulo Zmniejszanie liczby wymiarów Dane osobowe i prywatność danych Podsumowanie Rozdział 9. Podsumowanie Analizy lejka Rezygnacje, wygaśnięcia i inne definicje utraty klientów Analiza koszykowa Materiały Książki i blogi Zbiory danych Uwagi końcowe O autorze: Cathy Tanimura jest analityczką danych z ponad dwudziestoletnim doświadczeniem. Odnosiła również sukcesy, budując zespoły do spraw analizy danych i tworząc potrzebną infrastrukturę. Zajmowała się także zarządzaniem zespołami w kilku czołowych firmach technologicznych. Od wielu lat używa języka SQL do pracy z większością komercyjnych i otwartych baz danych.
Ta praktyczna książka jest przeznaczona dla analityków danych i danologów, którzy chcą używać SQL-a do eksploracji dużych zbiorów danych. Pokazuje zarówno popularne, jak i nieco mniej znane techniki budowania zapytań SQL, dzięki czemu możliwe staje się rozwiązywanie nawet bardzo zawiłych problemów i optymalne wykorzystanie właściwości tego języka w pracy na danych. W nowy, innowacyjny sposób przedstawiono tu takie pojęcia jak złączenia, funkcje okna, podzapytania i wyrażenia regularne. Zademonstrowano, jak łączyć różne techniki, aby szybciej osiągać cele za pomocą łatwego do zrozumienia, czytelnego kodu. Opisywany materiał został zilustrowany licznymi przykładami zapytań SQL, dzięki czemu można płynnie przejść do rozwiązywania konkretnych problemów z zakresu przetwarzania, analizy i eksploracji danych.
Najciekawsze zagadnienia:
przygotowywanie danych do analizy
analizy szeregów czasowych z wykorzystaniem SQL
analizy kohortowe do badania zachodzących zmian
analiza tekstu za pomocą zaawansowanych funkcji i operatorów SQL
wykrywanie odstających wartości
analizy eksperymentów (testy A/B)
SQL: tak wyciągniesz z danych rzetelne wnioski!
Spis treści: Przedmowa Rozdział 1. Analizy z wykorzystaniem SQL-a Czym jest analiza danych? Dlaczego SQL? Czym jest SQL? Korzyści, jakie daje SQL SQL a R lub Python SQL jako element procesu analizy danych Rodzaje baz danych i sposoby pracy z nimi Wierszowe bazy danych Kolumnowe bazy danych Inne rodzaje infrastruktury danych Podsumowanie Rozdział 2. Przygotowywanie danych do analiz Typy danych Typy danych w bazach Dane ustrukturyzowane i nieustrukturyzowane Dane ilościowe i jakościowe Dane z pierwszej, drugiej i trzeciej ręki Dane rzadkie Struktura zapytań w SQL-u Profilowanie - rozkład danych Histogramy i częstość wystąpień Binning Technika n przedziałów Profilowanie - jakość danych Wykrywanie duplikatów Deduplikacja za pomocą klauzul GROUP BY i DISTINCT Przygotowania - oczyszczanie danych Oczyszczanie danych za pomocą przekształceń w instrukcji CASE Konwersja i rzutowanie typów Radzenie sobie z wartościami null: funkcje coalesce, nullif i nvl Brakujące dane Przygotowania - kształtowanie danych Docelowe zastosowanie - analiza biznesowa, wizualizacja, obliczanie statystyk, uczenie maszynowe Tworzenie tabel przestawnych za pomocą instrukcji CASE Przywracanie struktury po przestawieniu z użyciem instrukcji UNION Funkcje pivot i unpivot Podsumowanie Rozdział 3. Analiza szeregów czasowych Operacje na datach, czasie oraz datach i czasie Zmiana strefy czasowej Konwersja formatu dat i znaczników czasu Obliczenia matematyczne na datach Obliczenia na czasie Złączanie danych z różnych źródeł Zbiór danych o sprzedaży detalicznej Analiza trendów w danych Proste trendy Porównywanie komponentów Obliczanie procentów z całości Stosowanie indeksacji do badania zmian procentowych w czasie Okna przesuwne Obliczenia na podstawie okien przesuwnych Okna przestawne w rzadkich zbiorach danych Obliczanie wartości skumulowanych Analiza danych z efektem sezonowości Porównywanie okres do okresu - rdr i mdm Porównania okres do okresu - te same miesiące z kolejnych lat Porównywanie z wieloma wcześniejszymi okresami Podsumowanie Rozdział 4. Analiza kohortowa Kohorty - przydatny model analiz Zbiór danych o członkach Kongresu Utrzymanie Kod w SQL-u do tworzenia prostej krzywej utrzymania Modyfikowanie szeregów czasowych, aby zwiększyć dokładność wyników analizy utrzymania Kohorty tworzone na podstawie szeregów czasowych Definiowanie kohort na podstawie odrębnej tabeli Jak radzić sobie z kohortami rzadkimi? Definiowanie kohort na podstawie dat innych niż początkowa Powiązane analizy kohortowe Przeżywalność Powroty (ponowne zakupy) Obliczanie skumulowanych wartości Analiza przekrojowa w kontekście analizy kohortowej Podsumowanie Rozdział 5. Analiza tekstu Po co analizować tekst za pomocą SQL-a? Czym jest analiza tekstu? Dlaczego SQL jest dobrym narzędziem do analizy tekstu? Kiedy SQL nie jest dobrym wyborem? Zbiór danych o obserwacjach UFO Cechy tekstu Parsowanie tekstu Przekształcanie tekstu Znajdowanie elementów w większych blokach tekstu Dopasowywanie symboli wieloznacznych: LIKE i ILIKE Dokładne dopasowywanie za pomocą operatorów IN i NOT IN Wyrażenia regularne Tworzenie tekstu i zmienianie jego kształtu Konkatencja Zmiana kształtu tekstu Podsumowanie Rozdział 6. Wykrywanie anomalii Możliwości i ograniczenia SQL-a w zakresie wykrywania anomalii Zbiór danych Wykrywanie wartości odstających Wyszukiwanie anomalii za pomocą sortowania Wyszukiwanie anomalii na podstawie percentyli i odchylenia standardowego Tworzenie wykresów w celu znajdowania anomalii Rodzaje anomalii Anomalne wartości Anomalne liczby wystąpień Anomalie w postaci braku danych Radzenie sobie z anomaliami Badanie anomalii Usuwanie danych Zastępowanie innymi wartościami Skalowanie Podsumowanie Rozdział 7. Analiza eksperymentów Wady i zalety analizy eksperymentów za pomocą SQL-a Zbiór danych Rodzaje eksperymentów Eksperymenty z wynikami binarnymi - test chi-kwadrat Eksperymenty z wynikami ciągłymi - test t Problemy z eksperymentami i sposoby radzenia sobie z błędami Przydział jednostek do wariantów Wartości odstające Okna czasowe Eksperymenty związane z wielokrotną ekspozycją Co robić, gdy kontrolowane eksperymenty są niemożliwe? Inne analizy Analiza "przed i po" Analiza eksperymentów naturalnych Analiza populacji w okolicy wartości progowej Podsumowanie Rozdział 8. Tworzenie złożonych zbiorów danych na potrzeby analiz Kiedy używać SQL-a do tworzenia złożonych zbiorów danych? Zalety stosowania SQL-a Kiedy używać procesu ETL? Kiedy umieszczać logikę w innych narzędziach? Porządkowanie kodu Komentarze Wielkość liter, wcięcia, nawiasy i inne sztuczki z obszaru formatowania Przechowywanie kodu Porządkowanie obliczeń Porządek przetwarzania klauzul w SQL-u Podzapytania Tabele tymczasowe Wyrażenia CTE Instrukcja grouping sets Zarządzanie wielkością zbioru danych i prywatnością Próbkowanie na podstawie wartości procentowych i dzielenia modulo Zmniejszanie liczby wymiarów Dane osobowe i prywatność danych Podsumowanie Rozdział 9. Podsumowanie Analizy lejka Rezygnacje, wygaśnięcia i inne definicje utraty klientów Analiza koszykowa Materiały Książki i blogi Zbiory danych Uwagi końcowe O autorze: Cathy Tanimura jest analityczką danych z ponad dwudziestoletnim doświadczeniem. Odnosiła również sukcesy, budując zespoły do spraw analizy danych i tworząc potrzebną infrastrukturę. Zajmowała się także zarządzaniem zespołami w kilku czołowych firmach technologicznych. Od wielu lat używa języka SQL do pracy z większością komercyjnych i otwartych baz danych.
Podstawowe informacje |
|
---|---|
Autor | Cathy Tanimura |
Wybrane wydawnictwa ?Wybrane wydawnictwa to renomowane firmy, które publikują książki, znane z wysokiej jakości, różnorodności tytułów i często specjalizujące się w konkretnych gatunkach literatury. | Helion |
Okładka ?Okładka książki to zewnętrzna część, która chroni i prezentuje treść. To pierwszy element, który przyciąga uwagę czytelników, zawierając tytuł, autora i grafikę. | Broszura |
Rok wydania ?Rok, w którym książka została opublikowana i dostępna dla czytelników. Pomaga określić, jak dawno została wydana. | 2020 |
Ilość stron ?Ilość stron to liczba kartek z tekstem wewnątrz książki, która określa jej długość i objętość treści. | 304 |
Przedmiot ?Przedmiot w podręcznikach szkolnych to konkretna dziedzina nauki lub temat, który jest omawiany i uczony w danej książce. | Technika i informatyka |
ISBN | 9788328388956 |
Produkty rekomendowane
Analiza danych z wykorzystaniem SQL-a... - Pytania i odpowiedzi
Zastanawiasz się jak poprawnie użytkować zakupiony produkt? Porady na forum naszych ekspertów w mig rozwieją Twoje wątpliwości! Pytania i Odpowiedzi pomogą użytkownikom serwisu w poprawnym korzystaniu i cieszeniu się z nowo zakupionych produktów.
Produkty rekomendowane
Wybrane oferty
-
- Dane i opinie o Helion
- Zobacz ofertę
- O ofercie
-
Zgłoś uwagi
Warianty tego produktu
-
44,85złAnaliza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekształcania danych we wnioski
-
Najgorętsze okazje do -30%
- Dane i opinie o Empik
- Zobacz ofertę
- O ofercie
-
Zgłoś uwagi
Warianty tego produktu
-
46,99złAnaliza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekształcania danych we wnioski
Analiza danych z wykorzystaniem SQL-a... - Pozostałe oferty
-
- Dane i opinie o swiatksiazki.pl
- Zobacz ofertę
- O ofercie
-
Zgłoś uwagi
Warianty tego produktu
-
45,00złAnaliza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekształcania danych we wnioski | Odbiór w księgarni za 0 zł lub bezpłatna wysyłka od 1
-
- Dane i opinie o ebookpoint.pl
- Zobacz ofertę
- O ofercie
-
Zgłoś uwagi
Warianty tego produktu
-
48,30złAnaliza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekształcania danych we wnioski
-
- Dane i opinie o skupszop.pl
- Zobacz ofertę
- O ofercie
-
Zgłoś uwagi
Warianty tego produktu
-
48,41złAnaliza danych z wykorzystaniem SQL-a... | Kup jeszcze taniej wersję używaną!
-
- Dane i opinie o ksiegarnia.pwn.pl
- Zobacz ofertę
- O ofercie
-
Zgłoś uwagi
Warianty tego produktu
-
49,66złAnaliza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekształcania danych we wnioski
-
- Dane i opinie o matras.pl
- Zobacz ofertę
- O ofercie
-
Zgłoś uwagi
Warianty tego produktu
-
50,44złAnaliza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekształcania danych we wnioski
-
- Dane i opinie o chodnikliteracki.pl
- Zobacz ofertę
- O ofercie
-
Zgłoś uwagi
Warianty tego produktu
-
50,44złAnaliza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekształcania danych we wnioski
-
- Dane i opinie o smakliter.pl
- Zobacz ofertę
- O ofercie
-
Zgłoś uwagi
Warianty tego produktu
-
50,55złAnaliza danych z wykorzystaniem SQL-a...
-
-
- Dane i opinie o Ameo.pl
- Zobacz ofertę
- O ofercie
-
Zgłoś uwagi
Warianty tego produktu
-
51,12złAnaliza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekształcania danych we wnioski
-
- Dane i opinie o Księgarnia znak.com.pl
- Zobacz ofertę
- O ofercie
-
Zgłoś uwagi
Warianty tego produktu
-
52,26złAnaliza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekształcania danych we wnioski
-
- Dane i opinie o matfel.pl
- Zobacz ofertę
- O ofercie
-
Zgłoś uwagi
Warianty tego produktu
-
56,02złAnaliza danych z wykorzystaniem SQL-a... - Cathy Tanimura
-
- Dane i opinie o Księgarnia DobraKsiazka.pl
- Zobacz ofertę
- O ofercie
-
Zgłoś uwagi
Warianty tego produktu
-
58,33złAnaliza danych z wykorzystaniem SQL-a.. Zaawansowane techniki przekształcania danych we wnioski
-
- Dane i opinie o dvdmax.pl
- Zobacz ofertę
- O ofercie
-
Zgłoś uwagi
Warianty tego produktu
-
59,99złAnaliza danych z wykorzystaniem SQL-a. - Cathy Tanimura [KSIĄŻKA]
-
- Dane i opinie o EDUKAMP.PL
- Zobacz ofertę
- O ofercie
-
Zgłoś uwagi
Warianty tego produktu
-
63,01złAnaliza danych z wykorzystaniem SQL-a... EDUKAMP
Pokaż wszystkie 19 ofert
?
Dlaczego niektóre oferty są ukryte?
Domyślnie wyświetlamy maksymalnie 15 ofert: do 3 ofert które mogą zostać wyświetlone w obszarze "Wybrane oferty" (oferty, których kolejność wyświetlenia została opłacona przez kontrahenta) oraz do 12 spośród pozostałych prezentowanych od najniższej do najwyższej ceny z uwzględnieniem dodatkowych parametrów, takich jak: preferencje użytkownika i liczba przejść do sklepu.
Po kliknięciu w 'pokaż wszystkie oferty' pojawi się pełna lista ofert z wszystkich sklepów.
Historia cen - trend cenowy
Aktualnie najniższa cena: 44,85zł
Często kupowane razem
Reklama - oferty sklepów
Produkty rekomendowane
Wybrane oferty
?
Analiza danych z wykorzystaniem SQL-a... - Opinie
Klienci, którzy kupili Analiza danych z wykorzystaniem SQL-a..., mogą podzielić się swoją opinią poprzez ankietę Zaufanych Opinii. Prezentujemy wszystkie oceny (zarówno pozytywne jak i negatywne), a Zaufane Opinie oznaczone są zieloną tarczą.
Produkty rekomendowane