Parsero Definition

Aus Xinux Wiki
Zur Navigation springen Zur Suche springen

Grundlegendes

  • Parsero liest die Robots.txt eines Web-Servers aus und es werden Disallow-Einträge angezeigt.
  • Disallow-Einträge sind die Links die nicht von Suchmaschinen indexiert werden dürfen.

Bildschirmfoto von 2021-08-12 15-38-00.png

Robots.txt

  • Man kann damit Teile oder eine komplette Website für Webcrawler sperren.
  • Sie ist das erste Dokument das ein Bot beim Crawlen der Website aufruft.