Na początek zagadka – co łączy: 125 km dróg ekspresowych, 90 km autostrad, 17 myśliwców F-16, 160 czołgów Leopard 2A5 (obecnie Wojsko Polskie ma na stanie 105 takich czołgów), 5000 orlików, 3 Stadiony Narodowe, 500 czteropiętrowych bloków mieszkalnych, 125 000 małych samochodów i 1/3 kopalni węgla brunatnego?
Odpowiedź jest stosunkowo prosta: każdy z powyższych punktów możemy mieć za – bagatela – 5 000 000 000 złotych. Słownie: PIĘĆ MILIARDÓW ZŁOTYCH.
Co jeszcze możemy dostać za 5 miliardów złotych? Otóż możemy za to mieć wszystkie skradzione/utracone w ciągu roku towary w polskich placówkach handlowych. Nieźle, prawda?
5 miliardów złotych to szacunkowa roczna wartość strat i kradzieży w polskich sklepach. Jeśli podzielimy to przez szacunkową liczbę funkcjonujących placówek – wyjdzie nam, że średnio każdy sklep w Polsce notuje roczne straty w wysokości około 13,5 tysiąca złotych. Skala zjawiska jest więc naprawdę niebagatelna.
Rewolucja zbliża się dużymi krokami
Trudno więc dziwić się, że w ostatnich miesiącach kwestie związane z szeroko pojętym loss prevention są głównym tematem moich rozmów z sieciami handlowymi i jednocześnie przedmiotem całej masy nowych projektów ukierunkowanych na zapobieganie kradzieżom i minimalizowanie strat.
Ponieważ drugim tematem przewodnim rozmów z klientami sieciowymi jest sztuczna inteligencja – bardzo często kwestie te zaczynają łączyć się ze sobą i zasypywany jestem pytaniami o potencjalny wpływ AI na loss prevention. Najczęstsze pytanie, które pojawia się w tym kontekście, to: czy to już rewolucja?
Odpowiedź na to pytanie jest i prosta, i złożona zarazem. Z jednej strony dziś w żaden sposób nie możemy mówić o rewolucji, z drugiej – jednak dość mocno czuć, że zbliża się ona dużymi krokami, a szerokie zastosowanie sztucznej inteligencji w służbie loss prevention zdaje się czaić tuż za rogiem.
Trzeba jednak jasno podkreślić, że AI w szeroko pojętej analizie wideo znajduje się o dobrych kilka kroków za AI znaną chociażby z niezwykle popularnego w ostatnim czasie ChatGPT.
Wpływa na to kilka czynników. Po pierwsze praca na danych tekstowych, zbiorach bazodanowych i generalnie wszystkim, co można w jakikolwiek sposób zapisać, jest dużo łatwiejsza z punktu widzenia machine learning niż praca na obrazach czy materiałach wideo. Przekaz tekstowy czy liczbowy dużo łatwiej zrozumieć, poddać analizie i oprzeć na nim algorytmy uczące niż na zdjęciach czy filmach. Po drugie analiza obrazu jest obwarowana uregulowaniami prawnymi, które – oczywiście w jak najbardziej słusznej intencji – dość mocno ograniczają realne możliwości posługiwania się sztuczną inteligencją w obszarze CCTV. Innymi słowy – z wielu możliwości technologicznych po prostu nie wolno korzystać.
Analiza obrazu z wykorzystaniem sztucznej inteligencji
Abstrahując od ograniczeń prawnych i odnosząc się już bezpośrednio do trudności związanych z zastosowaniem sztucznej inteligencji w analizie wideo versus chociażby ChatGPT – proszę sobie wyobrazić komunikat słowny: „To jest czarny długopis”. Jasna, prosta i klarowna informacja wskazująca, że mamy do czynienia z czarnym długopisem. A teraz proszę sobie wyobrazić, że ów czarny długopis pokazujemy na obrazie. I to obrazie zdefiniowanym przez pole i kąt widzenia oraz jakość kamery. Jeśli bardzo zbliżymy ten długopis do kamery, ustawimy go pod odpowiednim kątem i w odpowiednim oświetleniu – jasne będzie, że to czarny długopis. Ale co, jeśli ten długopis znajdzie się daleko od kamery, będą padały na niego różne cienie i dodatkowo będzie częściowo przesłonięty? A jeśli wokół tego długopisu położymy kilka bardzo podobnych przedmiotów? Wówczas nawet analiza obrazu ludzkim okiem nie da nam pewności, że to długopis, a nie na przykład ołówek czy pióro, i że jest on faktycznie czarny, a nie ciemnoniebieski, stalowy, ciemnoszary czy granatowy. W określonych warunkach wydać się nam może nawet zielony.
Powyższy przykład pokazuje (a proszę mi wierzyć, że z reguły rzeczywiste środowisko funkcjonowania analizy obrazu jest nieporównywalnie bardziej złożone), że analiza obrazu z wykorzystaniem sztucznej inteligencji jest niemałym wyzwaniem.
Rozwiązania dopasowane do przestrzeni sklepowej
Czy w takim razie nie ma obecnie szans na zastosowanie AI choćby w obszarze loss prevention?
Oczywiście, że nie. Można i należy ją stosować – kluczowe jest jednak projektowanie rozwiązań przede wszystkim na podstawie znajomości uwarunkowań przestrzeni sklepowej, możliwości systemu, doświadczenia we współpracy z sieciami handlowymi i znajomości ich potrzeb oraz występujących realnie w sklepach zagrożeń związanych z kradzieżami.
Istnieje kilka przykładów rozwiązań, które z powodzeniem w wielu placówkach handlowych już funkcjonują i udowodniły swoją skuteczność, wyrażoną w konkretnych wskaźnikach zmniejszenia liczby kradzieży i wartości strat.
Z grubsza można podzielić tego typu rozwiązania na dwie grupy: analiza produktowa oraz analiza behawioralna.
W zakresie analizy produktowej najpopularniejszym rozwiązaniem jest monitorowanie półek sklepowych. To sposób dość powszechnie znany i wykorzystywany w merchandisingu czy zarządzaniu gospodarką towarową. Na podobnej zasadzie możemy również monitorować określone półki sklepowe pod kątem ich zapełnienia. Dla przykładu – monitorujemy półkę z drogimi alkoholami. Po ściągnięciu jednej butelki alkoholu zmienia się obraz tej półki, system generuje coś na kształt prealertu. Po upływie określonego czasu (do zdefiniowania w zależności od charakterystyki placówki) następuje porównanie danych z systemu POS – jeśli towar ten nie pojawił się w transakcji kasowej, można włączyć alarm (w dowolnej formie) z wygenerowanymi automatycznie materiałami wideo, przyporządkowanymi do zdarzenia i pozwalającymi na szybkie skontrolowanie ścieżki produktu. W szybki i łatwy sposób pozwala to zareagować w czasie rzeczywistym na niepożądane zdarzenia.
W analizie behawioralnej sytuacja jest podobna, przy czym monitorujemy tutaj określone zachowania. W przypadku półki z alkoholem nie będziemy badać obrazu samej półki, ale obraz wyciągniętej w jej kierunku ręki, w ruchu określającym ściąganie z niej towaru. Dalej scenariusz działania może być podobny. Oczywiście analiza behawioralna może mieć dużo szersze zastosowanie i służyć do wykrywania jakichkolwiek innych, zdefiniowanych zachowani, np. chowania produktu do torby/plecaka, szybkiego przemieszczania się czyn nietypowych ruchów.
Kasy samoobsługowe – strefy pod szczególnym nadzorem
Obecnie najpopularniejszym i najbardziej pożądanym rozwiązaniem w zakresie wykorzystania sztucznej inteligencji w analityce CCTV jest jednak analiza kas samoobsługowych. To strefa z jednej strony najbardziej „wrażliwa” z punktu widzenia generowania strat i kradzieży, z drugiej strony jest to obszar dość mocno zdefiniowany i stosunkowo wdzięczny z punktu widzenia zastosowania syntezy obrazu. Sztuczna inteligencja pozwala nam tutaj na zastosowanie zarówno rozwiązań z zakresu analizy produktowej, jak i behawioralnej.
W obszarze SCO z pomocą sztucznej inteligencji możemy wykrywać przeciągnięcie towaru nad skanerem bez skanowania (zakrycie dłonią kodu), zakończenie transakcji bez płatności czy podmianę kodu kreskowego na produkcie. Dla tych wszystkich zdarzeń – i nie tylko – opracowano specjalne algorytmy, pozwalające na wykrywanie podobnych zdarzeń w czasie rzeczywistym i generowanie natychmiastowych alertów.
Podsumowując – wartość strat i kradzieży w placówkach handlowych niestety stale rośnie i nie zanosi się raczej na to, aby to zjawisko zmalało w najbliższej przyszłości. Na szczęście równolegle stale rosną możliwości technologiczne, które mogą znacznie pomóc uchronić się przed wymienionymi zjawiskami.
Sztuczna inteligencja w zakresie analizy obrazu naprawdę mocno puka do bram i tylko kwestią czasu jest, kiedy będzie można ją powszechnie wykorzystywać w obszarze loss prevention. Już dziś możemy się posiłkować AI w wielu przypadkach, osiągając przy tym bardzo dobre rezultaty. Same możliwości to jednak nie wszystko – w tym obszarze sztuczna inteligencja jest tylko narzędziem. Najważniejsze, by dostrzec, w jaki sposób ją wykorzystywać.
Autorem tekstu jest Armen Moska, Business Development Manager Retail Technology Solutions, Hikvision Polska.
Hikvision, to międzynarodowy lider w produkcji i dostarczaniu rozwiązań bezpieczeństwa oraz AIoT. Firma jest Partnerem Strategicznym serwisu Omnichannelnews.pl.