Blog OChK

Jak zbudować skuteczne rozwiązania Machine Learning w 3 krokach?

Linkedin logoX logo
Jak zbudować skuteczne rozwiązania Machine Learning w 3 krokach?
Jak zbudować skuteczne rozwiązania Machine Learning w 3 krokach?

W obecnych czasach strategie biznesowe wielu firm kształtowane są przez rozwijające się wokół technologie, w tym Machine Learning. Nic więc dziwnego, że ci, którzy chcą być na bieżąco z trendami, wyprzedzać konkurencję i poprawiać doświadczenia swoich klientów mocno stawiają na projektowanie rozwiązań wykorzystujących algorytmy uczenia maszynowego, nie zawsze – niestety – z powodzeniem. Jak przekuć eksperyment w realną wartość biznesową? Z tego wpisu dowiesz się, jakie kroki podjąć, by zakończyć go skutecznym, produkcyjnym wdrożeniem.

Czym jest uczenie maszynowe?

Rozpoznawanie obrazu i mowy, analiza tekstu, prognozowanie, wsparcie w podejmowaniu decyzji – tak zdefiniowana sztuczna inteligencja (AI) obecna jest w coraz większej liczbie procesów biznesowych i od jakiegoś czasu stała się wyznacznikiem zaawansowania technologicznego organizacji. Pojęcie sztucznej inteligencji bardzo często jednak stosowane jest zamiennie właśnie z uczeniem maszynowym (ML). Czym więc jest i jak działa uczenie maszynowe?

Machine Learning

Obie dziedziny są ze sobą ściśle powiązane. Podczas gdy sztuczna inteligencja skupia się na imitowaniu ludzkiej inteligencji w rozmaitych kontekstach, zadaniem Machine Learning jest przede wszystkim analiza, interpretacja i wykorzystanie dużych baz danych (big data) do uczenia się i doskonalenia algorytmów bez wyraźnej konieczności ich programowania. Uczenie maszynowe stanowi podzbiór sztucznej inteligencji i jest jednym z narzędzi, które umożliwia tworzenie jej systemów. ML stanowi zatem często kluczowy składnik rozwiązań AI, umożliwiając ich adaptację i doskonalenie na bazie zgromadzonych danych oraz doświadczenia.

Presja środowiska biznesowego, a uczenie maszynowe w praktyce

Analizując dzienną porcję informacji zamieszczanych w mediach społecznościowych, portalach branżowych i artykułach poświęconych rozwojowi biznesu, wydawałoby się, że wysnuć można jeden wniosek – jeśli wykorzystanie sztucznej inteligencji poprzez wdrożenie narzędzi do uczenia maszynowego jest dopiero w planach Twojej organizacji, prawdopodobnie już teraz pozostajesz kilka kroków za swoją konkurencją. Czy tak jest naprawdę?

Z jednej strony, potrzeba gromadzenia i analizowania danych dla realizacji celów biznesowych jest już niemal tak samo oczywista, jak niegdyś potrzeba przeprowadzenia rewolucji przemysłowej. Nie jest już zaskoczeniem, że dane to kluczowy czynnik, który obecnie napędza biznes, dlatego odpowiedź na pytanie, czy warto w ogóle wdrażać Machine Learning jest bardzo prosta. Z drugiej strony, według Forbes, większość modeli nauczania maszynowego nigdy nie wchodzi nawet do faktycznego użycia biznesowego (czyli na tzw. produkcję) lub bardzo szybko napotyka istotne problemy.

Wdrażanie projektów ML jest bardzo złożonym procesem, dlatego podążanie za trendami bez odpowiedniego przygotowania może Twoją firmę wiele kosztować. Jak ograniczyć liczbę nieudanych projektów i w pełni wykorzystać potencjał uczenia maszynowego? Poniżej znajdziesz kilka wskazówek, które pozwolą Ci zaplanować cały proces.

Krok 1: pomysł biznesowy i wstępny plan realizacji

Jednym z często powielanych mitów jest to, że kluczową rolę przy wprowadzeniu uczenia maszynowego do organizacji pełnią osoby na stanowiskach Data Scientists. O ile, biorąc pod uwagę kompetencje techniczne, jest to prawda, o tyle cały proces wdrażania technologii powinien poprzedzony zostać dyskusją na szczeblu biznesowym. Zanim pozwolisz swoim inżynierom wypłynąć na jezioro danych, nadaj kierunek łodzi, którą mają popłynąć.

Machine Learning plan

Kluczowymi pytaniami, na które najpierw musisz sobie odpowiedzieć, są:

  • Dlaczego chcę rozpocząć dany projekt i jaki efekt chcę osiągnąć?
  • Jaki problem należy rozwiązać?
  • Czego potrzebuję, by dostarczyć wartość biznesową?

Motywacją do tego, by zacząć wykorzystywać algorytmy uczenia maszynowego w organizacji bardzo często jest po prostu chęć skorzystania ze zgromadzonych danych lub przeświadczenie o tym, że dany problem można rozwiązać za pomocą ML. Tego typu pobudki nie są bezzasadne, natomiast przy ograniczonych zasobach priorytetem powinny być przede wszystkim:

  • istotność danego problemu dla firmy,
  • wartość biznesowa, jaką niesie za sobą jego rozwiązanie,
  • gotowość procesów biznesowych do tego, by efektywnie wykorzystać owoce wykonanej pracy.

Warto także określić model ML (segmentacyjny? mierzący skłonność do zakupu?) oraz przygotować odpowiednie zasoby (jakie dane będą wartościowe do wyjaśnienia danego zjawiska? jaki zespół powinien być zaangażowany w prace? czy mamy narzędzia niezbędne do wykonania analizy?). Jeśli masz już odpowiedzi, przejdź do kolejnego kroku, czyli formułowania wymagań i weryfikacji hipotez.

Krok 2: formułowanie wymagań i weryfikacja hipotez

Przed zaangażowaniem się w dany problem sformułuj mierzalne korzyści, jakich oczekujesz w fazie końcowej, np. aby model wykrywania podejrzanych transakcji finansowych był opłacalny, musi być o co najmniej 20% bardziej skuteczny od dotychczasowych reguł biznesowych. Nie pomijaj drugiej strony równania, czyli kosztów, np. decydujesz się zainwestować w budowę rozwiązania ML nie więcej niż 200 tys. złotych. Brak wstępnych założeń znacznie utrudnia monitorowanie projektu i podnoszenie flag, że nie rozwija się on tak, jak powinien.

Równie ważne jest także przeprowadzenie pierwszych analiz wykonalności dla hipotez. Odpowiedz sobie na kilka pytań. Czy masz wystarczająco wiele zaobserwowanych przypadków dla zjawiska, które chcesz przewidzieć? Czy dane jakimi dysponujesz okazują się być wartościowe w kontekście wyjaśnienia tego zjawiska? Wreszcie – jakich danych i ich historii potrzebujesz do budowy modelu? Czy ma do nich dostęp Data Scientist czy też musisz mu je dostarczyć z systemów źródłowych?

Odpowiedzi na te pytania powinny dostarczyć Ci wiedzy wystarczającej do podjęcia kluczowej decyzji jeszcze zanim zaangażujesz się w realizację projektu – być może już na tym etapie musisz się zatrzymać, by nie ponosić dodatkowych kosztów!

Machine Learning założenia

Krok 3: operacjonalizacja i korzyści skali

Ukoronowaniem procesu realizacji skutecznego projektu z zakresu uczenia maszynowego jest budowa i operacjonalizacja modelu analitycznego. Warto wydzielić w nim trzy podstawowe elementy składowe: platformę zarządzania danymi źródłowymi (Modern Data Lakehouse), platformę zarządzania cechami analitycznymi (Feature Engineering) oraz platformę zarządzania cyklem życia i operacjonalizacją modeli analitycznych (MLOps). Każdy z tych elementów spełnia istotną rolę w powodzeniu projektu.

Machine Learning korzyści

  • Modern Data Lakehouse to warstwa detalicznych danych źródłowych, czyli zakres informacyjny danych, z których możesz skorzystać, budując rozwiązania ML. Może obejmować on zarówno dane ustrukturyzowane (np. charakterystyki klienta czy profil produktowy), jak i nieustrukturyzowane (np. zdjęcia z linii produkcyjnej do klasyfikacji lub nagrania audio).
  • Platforma Feature engineering pozwala Ci z kolei zapanować nad repozytorium cech analitycznych – ich definicjami, wersjami, procesem naliczania, monitoringiem jakości i usługami serwowania ich dla odbiorców.
  • Platforma MLOps natomiast dostarcza jednolite repozytorium eksperymentów i modeli, kontroluje naliczanie scoringów i przechowuje je, monitoruje jakość modeli oraz zarządza usługami serwującymi ich wynikami.

Cechą wspólną platform Feature Engineering i MLOps jest optymalizacja procesów budowy, wdrażania i utrzymania rozwiązania przy większej skali użytkowania. O ile w organizacjach, które incydentalnie wykorzystują algorytmy ML nie są one konieczne (co nie znaczy, że nawet tam ich nie rekomendujemy!), to przy działalności na dużą skalę, tzn. przy kilkudziesięciu czy kilkuset modelach oraz tysiącach zmiennych używanych w predykcji stają się absolutnie niezbędne.

Samo posiadanie tych trzech elementów nie jest oczywiście gwarantem sukcesu, ale dostarcza narzędzia, dzięki którym zbierzesz potrzebne informacje i z większą łatwością nadzorować będziesz przebieg procesu modelowania.

Podsumowanie

Zastosowanie uczenia maszynowego w biznesie daje ogromne możliwości. Nie da się ukryć, że firmy wykorzystujące algorytmy ML zdecydowanie łatwiej i szybciej rozwijają innowacyjne produkty i usługi, a także wzmacniają swoją konkurencyjność na rynku. Warunkiem powyższego jest jednak odpowiedni plan działania. Pamiętaj, że:

  • wybranie właściwego obszaru do analizy jest kluczowe dla powodzenia projektu,
  • definiowanie precyzyjnych i mierzalnych celów pozwala kontrolować jego przebieg i reagować w odpowiednich momentach,
  • fakt, że nie masz wypracowanych wszystkich elementów na najwyższym poziomie, nie oznacza, że nie możesz zacząć działać.

Patrząc na powyższe punkty nieco szerzej, okazuje się, że sprawdzają się we wszystkich projektach biznesowych, nie tylko tych, które zakładają zastosowanie uczenia maszynowego. To nasuwa nam właściwy wniosek – Machine Learning nie jest magicznym pyłem, którego garść raz rzucona w przestrzeń, zmaterializuje nam gotowe, skuteczne rozwiązanie. Jak każda technologia, na bazie której budujesz nową usługę lub produkt, wymaga wyznaczania celów, organizowania procesu ich osiągania oraz ciągłego monitorowania generowanych wyników.

Opublikowane:

Autor:

Michał Hakenberg

ML Engineer

Powiązane lub podobne posty

Nowoczesne zarządzanie SOC przy użyciu IaC oraz procesów CI/CD

Nowoczesne zarządzanie SOC przy użyciu IaC oraz procesów CI/CD

Mateusz Mędel

blog