Scraping Camel

Jak pomáhá Scraping Camel

Aplikace Scraping Camel prochází HTML stránky webu. Získává z nich informace. Tyto informace uloží a vygeneruje z nich jeden výstupní CSV soubor.

Jak vypadá Scraping Camel

Schéma fungování aplikace

Jak funguje Scraping Camel

  1. Uživatel definuje doménu, kterou má Camel procházet. Např. "https://www.mergado.cz/`.
  2. Uživatel provede ověření domény - podobně jako u Google. Má na výběr vložení META značky do stránek, souboru na web či DNS záznam. Cílem je prokázat, že nejde o cizí web. Cizí weby nyní scrapovat není cílem aplikace.
  3. Uživatel nastaví jaké elementy chce z cílových HTML stránek získávat. Výchozí jsou title, meta description a podobně. Nabídka je stručná - protože uživatel si může nadefinovat vlastní elementy. To nastaví tak, že buď uvede HTML kód před a po dané informaci, nebo použije regulární výraz. Toto je velmi mocné a umožní získat z HTML stránky téměř jakoukoliv informaci.
  4. Uživatel nastaví, jak se mají jmenovat elementy se získanými informacemi ve výstupním CSV.
  5. Scraping Camel projde stránky cílové domény. K tomu je zapotřebí sitemap.xml. Camel bere informace o stránkách z ní. Bez sitemap.xml ho nelze použít! Vygeneruje výstupní CSV soubor.
  6. Scraping Camel sám automaticky postupně prochází dlouhodobě cílový web. Pokud se objeví nová stránka, najde ji a zpracuje. Pokud se informace na existující stránce změní, po zpracování promítne Camel změny do výstupního CSV.

K čemu se hodí výstupní CSV

  • SEO analýzy, datové analýzy produktů, kategorií a podobně. Velmi široké využití!
  • Lze zpracovávat i weby, které nejsou e-shopem! Jejich data lze zpracovat v Mergadu pro PPC DSA Google Ads či jinak zpracovat postupy obvyklými pro e-shopy!
  • Pokud shopsystém uživatele negeneruje XML (či jiné) feedy, může získat informace takto a dále je zpracovat v Mergadu pro reklamní systémy.

Pro koho je Scraping Camel určen

  • pro marketingové specialisty agentur
  • pro pracovníky e-shopů
  • pro SEO specialisty, odborníky na PPC...

Proč využít Scraping Camel

  • Umožní vám pracovní postupy feed marketingu, které znáte z e-shopů s XML feedy, aplikovat na weby bez košíku.
  • Získáte informace, které jsou na webu, avšak v datovém XML feedu nikoliv.
  • Narozdíl od desktopových SEO software jsou data automatizována průběžně a datové výstupy on-line dostupné pro další aplikace či datová napojení.
  • Výstupní CSV lze zpracovat v Mergadu a nebo jinou aplikací.
  • Velký přínos získaných dat.

Další informace

Administration

Um diese App zu aktivieren, ist es zunächst erforderlich, dass Sie einloggen .

Ochrana soukromí

Aby mohl Scraping Camel fungovat, potřebuje zpracovat vaše data. Zde vysvětlím jaká data to jsou. Obecně lze říct, že veškerá data, která Scraping Camel zpracovává, vidíte v jeho administraci. Na pozadí neukrývá žádná tajemství.

Konkrétní představu si uděláte po projití průvodce tvorbou nové "webové stránky" ve Scraping Camelovi. Z něj bude zřejmé, jaká data zpracuje a co s nimi udělá.

MERGADO API

Z MERGADO API bere Scraping Camel pouze základní informace, které jsou nezbytné pro autorizaci uživatele, který chce pracovat s administrací Scraping Camel.

Webové stránky

Posláním Scraping Camel je stahovat stránky webu, nalezená data zpracovat a poskytnout uživateli. Při tom platí:

  • Data jsou získávána z veřejných internetových stránek. Scraping Camel stáhne stránku Vašeho webu tak, jak ji vidí cizí uživatel např. v internetovém prohlížeči. K těmto datům tedy může přistupovat kdokoliv bez omezení.
  • Jaká data bude zpracovávat určí uživatel v nastavení elementů.
  • Po smazání "webové stránky" v administraci Scraping Camel uložená data smaže. Nadále budou data uložena v zálohách, a to po dobu cca 14 dnů. Následně zmizí zcela. Tyto zálohy jsou určeny pro obnovení celé aplikace v případě poruchy. Data záloh nejsou nijak zpracovávána. Slouží k obnově aplikace jako celku. Jednotlivé webové stránky individuálně obnovujeme.
  • Zpracovává pouze data z domén, k nimž uživatel prokázal vztah (např. vložením META značky do stránek, nastavením DNS záznamu aj.). Pokud stránky Vaší domény zpracovává, znamená to, že to nastavil někdo z Vašeho týmu, spolupracující marketingový odborník či agentura aj. Cizí domény v Scraping Camelovi uživatel zpracovávat nemůže!
  • Rychlost a četnost procházení URL domény určuje uživatel v nastavení aplikace.

Google API

Svůj přístup k doméně může uživatel prokázat, mimo jiné, pomocí API služby Google Search Console. Tato služba Scraping Camelovi řekne, zda má daný uživatel k doméně přístup. Jiné informace Scraping Camel z Google API nezískává.

Další informace

  • Vaše data jsou "vaše". Autoři Scraping Camela informace o Vašem nastavení neposkytují žádné cizí osobě.
  • Scraping Camel AI se učí z dat uživatelů. To v praxi znamená, že data získané z webových stránek mohou vést k vylepšení algoritmů AI.
  • Domény, které Scraping Camel využívá:
    • https://app.scrapingcamel.com/ na této doméně běží jádro aplikace. Uživatel s ní nejspíš do styku nepřijde nebo jen zřídka. To proto, že aplikace je dostupná v prostředí administrace MERGADO.
    • https://store.mergado.com/detail/scrapingcamel/ je výchozí stránka aplikace v MERGADO Store. Najdete zde informace o aplikaci, možnost aplikaci zapnout či vypnout.

Témata článku: ochrana soukromí, ochrana dat uživatelů

Bewertung

07/12/2023

Der Benutzer hat keinen Bewertungstext eingegeben

28/05/2023

Der Benutzer hat keinen Bewertungstext eingegeben

15/03/2021

Der Benutzer hat keinen Bewertungstext eingegeben