Jak działa las losowy (random forest)?
Wyjaśnienie działania algorytmu lasu losowego (random forest) w uczeniu maszynowym na prostym przykładzie z życia.
MiroslawMamczur.pl to blog prowadzony przez Mirosława Mamczura, doświadczonego Data Scientist z ponad 15-letnim stażem w analizie danych, uczeniu maszynowym i monetyzacji danych w dużych firmach. Na blogu znajdziesz artykuły o data science, sztucznej inteligencji (AI), uczeniu maszynowym i wizualizacji danych, które autor tłumaczy na język praktyki, od drzew decyzyjnych i lasów losowych poprzez wdrażanie modeli w kontenerach z Dockerem po wizualizacje swarmplot i ridgeline plot. Mirosław wierzy, że dzięki AI można nie tylko zwiększać efektywność biznesu, ale też zostawiać świat lepszym miejscem. Blog powstał, by dzielić się wiedzą w przystępny sposób, by inni mogli ją wykorzystać i wprowadzać zmiany dla dobra kolejnych pokoleń.
49 artykuły z tego bloga
Wyjaśnienie działania algorytmu lasu losowego (random forest) w uczeniu maszynowym na prostym przykładzie z życia.
Wyjaśnienie czym są drzewa decyzyjne w uczeniu maszynowym, jak działają i jakie mają zastosowania w klasyfikacji danych.
Wprowadzenie do wykresu roju (swarmplot) - jego zalety, wady oraz implementacja w Pythonie z użyciem biblioteki Seaborn.
Wyjaśnienie Dockera i konteneryzacji na przykładzie uruchomienia modelu uczenia maszynowego w kontenerze.
Praktyczny przewodnik po tworzeniu API do serwowania modeli uczenia maszynowego przy użyciu frameworka FastAPI.
Wyjaśnienie czym jest API (Interfejs Programowania Aplikacji) na przykładzie kelnera w restauracji oraz opis różnych rodzajów interfejsów API.
Wprowadzenie do wykresu ridgeline (joyplot): zalety, wady i ciekawostki historyczne związane z tą techniką wizualizacji danych.
Wprowadzenie do uczenia federacyjnego – nowego podejścia w uczeniu maszynowym, które trenuje modele bez centralizacji danych.
Wyjaśnienie działania regresji logistycznej - kluczowego modelu uczenia maszynowego do przewidywania prawdopodobieństw i klasyfikacji binarnej.
Poradnik z trikami na skuteczne wyszukiwanie informacji w Google dla programistów i nie tylko.
Analiza wykresów warstwowych: zastosowania, zalety, wady oraz implementacja w Pythonie z użyciem bibliotek matplotlib i seaborn.
Wywiad z ChatGPT o sztucznej inteligencji, jej możliwościach, architekturze i ograniczeniach.
Porównanie trzech głównych generatorów obrazów AI: DALL-E 2, Midjourney i Stable Diffusion, ich działania i dostępu.
Wprowadzenie do NannyML, biblioteki Python do szacowania wydajności modeli ML bez dostępu do rzeczywistych danych celu (ground truth).
Przewodnik po wykresie sunburst: definicja, zastosowanie, porównanie z mapą drzewa oraz wady tej metody wizualizacji danych hierarchicznych.
Wyjaśnienie czym jest dryf modelu (model drift) w uczeniu maszynowym i dlaczego ważne jest monitorowanie modeli po wdrożeniu na produkcji.
Przegląd ponad 50 najlepszych repozytoriów GitHub z zasobami o sztucznej inteligencji, uczeniu maszynowym i głębokim uczeniu.
Wprowadzenie do wykresu lizakowego: czym jest, kiedy go używać oraz jak stworzyć go w Pythonie przy użyciu biblioteki matplotlib.
Przewodnik po 16 metodach wyboru zmiennych (feature selection) w uczeniu maszynowym, wyjaśniający ich znaczenie dla jakości modeli.
Wprowadzenie do wyrażeń regularnych (regex) - podstawy składni, historia i praktyczne zastosowania w programowaniu.