Jak pomáhá Scraping Camel
Aplikace Scraping Camel prochází HTML stránky webu. Získává z nich informace. Tyto informace uloží a vygeneruje z nich jeden výstupní CSV soubor.
Jak vypadá Scraping Camel
Jak funguje Scraping Camel
- Uživatel definuje doménu, kterou má Camel procházet. Např. "https://www.mergado.cz/`.
- Uživatel provede ověření domény - podobně jako u Google. Má na výběr vložení META značky do stránek, souboru na web či DNS záznam. Cílem je prokázat, že nejde o cizí web. Cizí weby nyní scrapovat není cílem aplikace.
- Uživatel nastaví jaké elementy chce z cílových HTML stránek získávat. Výchozí jsou title, meta description a podobně. Nabídka je stručná - protože uživatel si může nadefinovat vlastní elementy. To nastaví tak, že buď uvede HTML kód před a po dané informaci, nebo použije regulární výraz. Toto je velmi mocné a umožní získat z HTML stránky téměř jakoukoliv informaci.
- Uživatel nastaví, jak se mají jmenovat elementy se získanými informacemi ve výstupním CSV.
- Scraping Camel projde stránky cílové domény. K tomu je zapotřebí sitemap.xml. Camel bere informace o stránkách z ní. Bez sitemap.xml ho nelze použít! Vygeneruje výstupní CSV soubor.
- Scraping Camel sám automaticky postupně prochází dlouhodobě cílový web. Pokud se objeví nová stránka, najde ji a zpracuje. Pokud se informace na existující stránce změní, po zpracování promítne Camel změny do výstupního CSV.
K čemu se hodí výstupní CSV
- SEO analýzy, datové analýzy produktů, kategorií a podobně. Velmi široké využití!
- Lze zpracovávat i weby, které nejsou e-shopem! Jejich data lze zpracovat v Mergadu pro PPC DSA Google Ads či jinak zpracovat postupy obvyklými pro e-shopy!
- Pokud shopsystém uživatele negeneruje XML (či jiné) feedy, může získat informace takto a dále je zpracovat v Mergadu pro reklamní systémy.
Pro koho je Scraping Camel určen
- pro marketingové specialisty agentur
- pro pracovníky e-shopů
- pro SEO specialisty, odborníky na PPC...
Proč využít Scraping Camel
- Umožní vám pracovní postupy feed marketingu, které znáte z e-shopů s XML feedy, aplikovat na weby bez košíku.
- Získáte informace, které jsou na webu, avšak v datovém XML feedu nikoliv.
- Narozdíl od desktopových SEO software jsou data automatizována průběžně a datové výstupy on-line dostupné pro další aplikace či datová napojení.
- Výstupní CSV lze zpracovat v Mergadu a nebo jinou aplikací.
- Velký přínos získaných dat.
Další informace
- Profil aplikace na Mergado fóru
- Kategorie na Mergado fóru pro zadávání dotazů, informace o funkcích aj.
- Oznamování novinek ve Scraping Cmaleovi
Administration
Um diese App zu aktivieren, ist es zunächst erforderlich, dass Sie einloggen .
Ochrana soukromí
Aby mohl Scraping Camel fungovat, potřebuje zpracovat vaše data. Zde vysvětlím jaká data to jsou. Obecně lze říct, že veškerá data, která Scraping Camel zpracovává, vidíte v jeho administraci. Na pozadí neukrývá žádná tajemství.
Konkrétní představu si uděláte po projití průvodce tvorbou nové "webové stránky" ve Scraping Camelovi. Z něj bude zřejmé, jaká data zpracuje a co s nimi udělá.
MERGADO API
Z MERGADO API bere Scraping Camel pouze základní informace, které jsou nezbytné pro autorizaci uživatele, který chce pracovat s administrací Scraping Camel.
Webové stránky
Posláním Scraping Camel je stahovat stránky webu, nalezená data zpracovat a poskytnout uživateli. Při tom platí:
- Data jsou získávána z veřejných internetových stránek. Scraping Camel stáhne stránku Vašeho webu tak, jak ji vidí cizí uživatel např. v internetovém prohlížeči. K těmto datům tedy může přistupovat kdokoliv bez omezení.
- Jaká data bude zpracovávat určí uživatel v nastavení elementů.
- Po smazání "webové stránky" v administraci Scraping Camel uložená data smaže. Nadále budou data uložena v zálohách, a to po dobu cca 14 dnů. Následně zmizí zcela. Tyto zálohy jsou určeny pro obnovení celé aplikace v případě poruchy. Data záloh nejsou nijak zpracovávána. Slouží k obnově aplikace jako celku. Jednotlivé webové stránky individuálně obnovujeme.
- Zpracovává pouze data z domén, k nimž uživatel prokázal vztah (např. vložením META značky do stránek, nastavením DNS záznamu aj.). Pokud stránky Vaší domény zpracovává, znamená to, že to nastavil někdo z Vašeho týmu, spolupracující marketingový odborník či agentura aj. Cizí domény v Scraping Camelovi uživatel zpracovávat nemůže!
- Rychlost a četnost procházení URL domény určuje uživatel v nastavení aplikace.
Google API
Svůj přístup k doméně může uživatel prokázat, mimo jiné, pomocí API služby Google Search Console. Tato služba Scraping Camelovi řekne, zda má daný uživatel k doméně přístup. Jiné informace Scraping Camel z Google API nezískává.
Další informace
- Vaše data jsou "vaše". Autoři Scraping Camela informace o Vašem nastavení neposkytují žádné cizí osobě.
- Scraping Camel AI se učí z dat uživatelů. To v praxi znamená, že data získané z webových stránek mohou vést k vylepšení algoritmů AI.
- Domény, které Scraping Camel využívá:
https://app.scrapingcamel.com/
na této doméně běží jádro aplikace. Uživatel s ní nejspíš do styku nepřijde nebo jen zřídka. To proto, že aplikace je dostupná v prostředí administrace MERGADO.https://store.mergado.com/detail/scrapingcamel/
je výchozí stránka aplikace v MERGADO Store. Najdete zde informace o aplikaci, možnost aplikaci zapnout či vypnout.
Témata článku: ochrana soukromí, ochrana dat uživatelů