V datech je síla. A díky nám k nim může mít přístup každý
Před dvěma lety museli propouštět a změnit fungování firmy. Nyní jim tržby rostou tempem 80 % ročně a získali investici 70 milionů korun od J&T Ventures, aby tempo růstu ještě znásobili. „S nástupem AI už tak velký hlad po datech ještě zesílil a cítíme velkou šanci udělat díru do světa,“ říká Jan Čurn, zakladatel a CEO startupu Apify zaměřeného na scraping a extrakci dat.
Před dvěma lety museli propouštět a změnit fungování firmy. Nyní jim tržby rostou tempem 80 % ročně a získali investici 70 milionů korun od J&T Ventures, aby tempo růstu ještě znásobili. „S nástupem AI už tak velký hlad po datech ještě zesílil a cítíme velkou šanci udělat díru do světa,“ říká Jan Čurn, zakladatel a CEO startupu Apify zaměřeného na scraping a extrakci dat.
Když se řekne scrapování, řada lidí si představí něco téměř nelegálního. Zatěžování webů, vysávání databází. Jak je to ve skutečnosti?
Scraping je proces stahování dat z webových stránek. Největší scrapingová firma na světě je Google, který scrapuje celý internet, aby k němu mohl udělat vyhledávání. I když tam někteří lidé mohou cítit negativní konotace, je to obrovsky pozitivní věc. Žijeme v digitální ekonomice, byznys se dělá online a v datech je síla. Čím víc má firma dat, tím lepší může dělat rozhodnutí a produkty. Web je největší zdroj dat, jaký kdy lidstvo postavilo, a my umožňujeme lidem k těm datům přistoupit a smysluplně je využít. Internet je otevřená platforma, a i když se ji někteří velcí hráči snaží uzavírat, díky scrapingu se udržuje otevřená pro všechny. Je to zcela legální a legitimní, pokud se to dělá správně. Výzva je v tom, že web je primárně dělaný pro konzumaci lidmi, ale pokud ho chcete využít strojově, jde to obtížně.
V čem spočívá technologická výzva a unikátnost vašich nástrojů?
Jak se web vyvíjí a je komplexnější, složitost scrapování roste. Často musíte používat plnohodnotný prohlížeč, protože obsah se třeba uživatelům renderuje dynamicky, načítá se za běhu. Potřebujete paralelně spouštět tisíce prohlížečů a udržovat frontu na stažení milionů stránek. A do toho řešíte, že se stránky scrapingu dost často snaží bránit. Musíte tedy jejich technická opatření obejít, tvářit se jako člověk na soukromém počítači. Blokovací systémy jsou stále sofistikovanější v odhalování robotů, využíváme proto velmi důmyslné postupy s pomocí strojového učení. Kdyby si to měli vývojáři řešit sami, stráví nad tím obrovské množství času. Firmy potřebují data a nechtějí řešit technické detaily scrapingu, to nechávají na nás.
Řešíte nějak i následnou analýzu dat?
My se soustředíme čistě na stahování dat, to je sám o sobě složitý infrastrukturní problém. Nechceme konkurovat spoustě zaběhnutých datových firem, naše expertíza je extrakce dat. Poskytujeme ale mnoho integrací na další databáze a systémy, kam si zákazník může získaná data nahrát a pracovat s nimi dál.
Jak široká je škála využití scrapingu, kdo všechno jsou vaši klienti?
Aktuálně máme 2500 pravidelných klientů a ta škála je ohromná, od Fortune 500 firem až po jednotlivce či malé startupy. Asi nejčastější use case je stále e-commerce. Prodejce zajímá, co se prodává, za kolik a kde. Díky scrapingu se vytváří větší konkurence, většina e-commerce firem se vzájemně sleduje. Další je oblast marketingu a sociálních médií. Velké sociální sítě často nemají API a firmy zajímá, o čem se mluví, jaká dostávají hodnocení, jaký je výkon jejich komunikace a podobně. Velmi populární jsou naše scrapery pro Facebook, Instagram či TikTok. Mimochodem, proto se právě jmenujeme Apify – umožňujeme apifikovat weby, které API nemají.
A další příklady využití?
Velká oblast je i lead generation, firmy potřebují kontakty a web je jejich největší zdroj. Třeba z online map lze získat cílené kontakty na podnikatele v určité lokalitě. Dále je to SEO. Pro firmy je důležité vědět, jak si stojí na Google Search, jenže ten nemá API, aby jim to řekl. Hodně zákazníků řeší také legal compliance, protože potřebují důkazy, že jejich web vypadal v určitém čase nějakým způsobem. To jsou třeba firmy nabízející kreditní karty a jiná přísně regulovaná odvětví.
Projevuje se už nějak nástup umělé inteligence?
AI je samozřejmě obrovsky rostoucí zdroj našich příjmů. Všechny velké generative AI modely jsou trénované na velkém množství dat stažených z webu právě pomocí scrapingu. S rozšiřováním AI technologií tedy logicky roste poptávka po datech, ať už pro trénink modelů anebo jejich doplňování daty pro tzv. Retrieval Augmented Generation (RAG). V této oblasti nás používá třeba globální customer service lídr Intercom pro své AI chatboty, které potřebuje krmit daty z webů svých zákazníků, aby správně odpovídali na otázky. Obecně tato oblast dat pro AI je pro nás velmi atraktivní a pracujeme na tom, abychom v ní byli lídři na trhu.
Jsou i jiné příklady použití Apify?
Často nás až překvapuje, jaká využití pro Apify lidé mají. Například pracujeme s americkou neziskovkou Thorn, která policii pomáhá hledat oběti obchodu s lidmi. Stahujeme pro ně data z amerických portálů nabízejících erotické služby, a když se na nich objeví nějaké pohřešované dítě či mladistvý, dokáží ho podle fotky najít. Už před pár lety uváděli, že takto našli přes 17 000 obětí. Scraping pomáhá nejen firmám vydělávat víc peněz, ale může prospívat celé společnosti. V Česku je příkladem Hlídač státu. Některé státní organizace nemají API, takže scraping je jediná možnost, jak stahovat a kontrolovat jejich smlouvy a dokumenty.
Nabízíte také automatizaci procesů na webu. To je separátní produkt?
Naše platforma je poměrně flexibilní a stahování dat je vlastně podmnožina automatizace. Abyste potřebná data našli, musíte například proklikat nějaké formuláře. A pak jsou tu zákazníci, kteří nepotřebují stahovat data, ale zajímá je právě to proklikávání formulářů. Třeba americká služba Rocket Money, která lidem pomáhá šetřit peníze. Analyzují výpisy z účtů a s naší pomocí umožňují jednoduše zrušit různá zbytečná předplatná různých služeb. Možných využití je opět spousta.
V roce 2022 prošla Apify rekonstrukcí a určitým hledáním identity. Jak jste na tom dnes?
Před dvěma lety nám najednou začal klesat obrat, museli jsme hledat úspory a snížit stavy. Udělali jsme pivot, zúžili focus a ujasnili si, co přesně chceme dělat a pro koho. Říká se, že nejdůležitější věc pro startup je focus, jenže když se daří a rostete, moc to neřešíte. Až když jsme museli hledat úspory, zaměřili jsme se na to, co přináší největší hodnotu zákazníkům. To nás velmi posunulo. Ujasnili jsme si, že naše cílová skupina jsou vývojáři a chceme být pro ně nejlepší platforma pro web scraping a automatizaci. Co do toho nezapadalo, to jsme přestali dělat. V posledním kvartálů roku 2023 jsme na obratu vyrostli o 80 % proti předchozímu roku. Samozřejmě se i změnil celý trh a přišla AI revoluce, ale to těžší období nám hodně prospělo.
Proč jste se teď rozhodli pro investici?
Jsme ziskoví, takže peníze nepotřebujeme na provoz, ale na to, abychom firmu překlopili z profitabilního mind setu na růstový. Abychom se nebáli investovat, měli větší rezervu a mohli se oprostit od počítání každé koruny. Chceme ukázat, že jsme schopni dál akcelerovat a přetavit peníze do škálovatelného růstu. Když se nám to podaří, máme potenciál udělat díru do světa.
Na co konkrétně peníze použijete?
Předně rozšiřujeme tým. Potřebujeme nabrat další vývojáře, lidi do produktového a datového týmu, abychom se dokázali rychleji posouvat na produktové roadmapě. Máme ambiciózní plány a chceme je uvést na trh dříve a rychleji. Další část půjde do marketingu. Cítíme, že naše produkty jsou tak vyspělé, že mohou oslovit mnohem víc firem, než jsme dosud získali. Jen se k nim potřebujeme dostat. Náš hlavní akviziční kanál je organický traffic, nyní ale navýšíme investice do placených reklam a dalších kanálů.
Jak tedy aktuálně svoje služby prodáváte?
Jsme product-ledgrowth firma. Abyste mohli náš produkt používat, nepotřebujete s nikým mluvit. Máme takový app store nazvaný Apify Store, kde je momentálně 1500 hotových řešení pro různé use casy. Když zákazník hledá na webu nástroj na extrakci dat, díky našemu obsahu a silné doménové autoritě najde Apify, na pár kliků si vše vyzkouší a snadno se pak může stát platícím zákazníkem. A když je spokojený, službu si zaintegruje a využívá nás čím dál víc.
Proč jste si jako investora vybrali právě J&T Ventures?
Zvažovali jsme udělat velké investiční kolo, kde bychom oslovili mnoho firem napříč trhem, ale nakonec jsme se rozhodli udělat pouze menší kolo, abychom firmu v této fázi nenarušili velkým množstvím externího kapitálu. Proto jsme se rozhodli pro silného místního partnera, kterého známe a důvěřujeme mu. J&T Ventures mají dobré renomé, slyšeli jsme na ně pouze chválu a s Martinem Kešnerem se známe mnoho let. Naším druhým investorem je Reflex Capital, dohromady jsme ale mezi roky 2016 a 2019 naraisovali jen kolem 500 tisíc dolarů. Víceméně jsme tedy dosud Apify bootstrapovali, a právě proto nám v této fázi nedávalo smysl raisovat stovky miliónů korun možná příště.