#020 Diagram cięciw (chord diagram)
Wprowadzenie do diagramów cięciw (chord diagrams) - metoda wizualizacji relacji w danych z przykładami implementacji w Pythonie.
MiroslawMamczur.pl to blog prowadzony przez Mirosława Mamczura, doświadczonego Data Scientist z ponad 15-letnim stażem w analizie danych, uczeniu maszynowym i monetyzacji danych w dużych firmach. Na blogu znajdziesz artykuły o data science, sztucznej inteligencji (AI), uczeniu maszynowym i wizualizacji danych, które autor tłumaczy na język praktyki, od drzew decyzyjnych i lasów losowych poprzez wdrażanie modeli w kontenerach z Dockerem po wizualizacje swarmplot i ridgeline plot. Mirosław wierzy, że dzięki AI można nie tylko zwiększać efektywność biznesu, ale też zostawiać świat lepszym miejscem. Blog powstał, by dzielić się wiedzą w przystępny sposób, by inni mogli ją wykorzystać i wprowadzać zmiany dla dobra kolejnych pokoleń.
49 artykuły z tego bloga
Wprowadzenie do diagramów cięciw (chord diagrams) - metoda wizualizacji relacji w danych z przykładami implementacji w Pythonie.
Wyjaśnienie działania algorytmu Isolation Forest do wykrywania anomalii w danych, opartego na drzewach decyzyjnych.
Wyjaśnienie wykrywania anomalii i wartości odstających w data science, z przykładami i zastosowaniami w wykrywaniu oszustw.
Wprowadzenie do wykresów świecowych, ich budowy oraz praktyczny przykład tworzenia takiego wykresu w Pythonie przy użyciu bibliotek plotly i yfinance.
Wprowadzenie do przetwarzania języka naturalnego (NLP), dziedziny AI, która uczy komputery rozumienia ludzkiego języka. Opis zastosowań i przykładów.
Wprowadzenie do metody SMOTE, która rozwiązuje problem niezbalansowanych danych w klasyfikacji poprzez generowanie syntetycznych próbek klasy mniejszościowej.
Wprowadzenie do diagramów sieci, ich rodzajów i praktycznego zastosowania w Pythonie z użyciem biblioteki networkx.
Wyjaśnienie problemu niezbalansowanych danych w klasyfikacji, przykładów takich zbiorów oraz sposobów radzenia sobie z tym wyzwaniem w ML.
Przewodnik po bibliotece Explainer Dashboard w Pythonie, która tworzy interaktywne dashboardy do wyjaśniania działania modeli uczenia maszynowego.
Analiza problemów z wykresami kołowymi, zasady ich poprawnego używania oraz przykłady kodu w Pythonie z biblioteką Plotly.
Tutorial wykorzystania sieci konwolucyjnych (CNN) do rozpoznawania zapalenia płuc na podstawie zdjęć rentgenowskich klatki piersiowej.
Wyjaśnienie działania konwolucyjnych sieci neuronowych (CNN), ich zalet w przetwarzaniu obrazów w porównaniu do prostych sieci MLP oraz historia ich powstania.
Wprowadzenie do diagramów Venna z przykładami kodu w Pythonie przy użyciu biblioteki matplotlib_venn do wizualizacji relacji między zbiorami danych.
Autor opowiada swoją historię przejścia z analityka danych do data scientist, opisując studia matematyczne i początki kariery w IT.
Wyjaśnienie czym są środowiska wirtualne w Pythonie i jak je tworzyć przy użyciu Anacondy do zarządzania zależnościami projektów.
Wprowadzenie do wykresów Gantta, ich zastosowanie w zarządzaniu projektami oraz praktyczny przykład tworzenia w Pythonie przy użyciu biblioteki Plotly.
Jak użyć GPT-2 w Google Colab do generowania romantycznych wierszy na Walentynki. Praktyczny przewodnik z kodem.
Wyjaśnienie działania sieci neuronowych typu transformer, ich architektury i zastosowań w przetwarzaniu języka naturalnego (NLP).
Wprowadzenie do map ciepła (heatmap) w wizualizacji danych, ich zastosowań oraz przykładowa implementacja w Pythonie z użyciem biblioteki Seaborn.
Praktyczny przewodnik po web scrapingu z użyciem BeautifulSoup, pokazujący jak pobierać dane z HTML na przykładzie poezji z Wikipedii.