Achtung: dieser Beitrag ist älter. Es kann sein, dass manche Inhalte nicht mehr aktuell sind.

Piwik: Web Analytics durch den Import von Webserver-Logdateien

Piwik
Piwik Web-Analyse für Urchin (Foto: Logo, Piwik)

Die 2005 von Google gekaufte Web-Analyse-Software Urchin stellt diesen Monat nun ihren Dienst ein. Nutzer, die nun nach einer Alternative suchen, könnte die Meldung der Open-Source Web-Analyse-Software Piwik ansprechen: Piwik verspricht, mit dem ganz aktuell als Beta veröffentlichten Script, dass alle Logdateien auf die von Urchin gewohnte Weise analysiert und bisherige Logs zu Piwik importiert werden können.

Piwik will Urchin ersetzen

Die Analyse von Webserver-Logdateien ist ein wichtiger Bestandteil von Webcontrolling-Maßnahmen. Mittels der über die Log-Analyse erstellten Statistiken können Webseitenbetreiber einsehen, wie viele User von welchen Webseiten auf den eigenen Internetauftritt gelangen, wie lange sie dort verweilen, welche Unterseiten aufgerufen werden etc. Auf diese Weise kann unter anderem ansatzweise nachvollzogen werden, welchen Erfolg SEO-Maßnahmen haben oder wie gut sich User auf der Webseite zurechtfinden. Den Markt der Web Analytics Software beherrscht zurzeit Google Analytics: Rund 55 Prozent der Internetuser nutzen dieses Tool, es wird für 15 Millionen Webseiten eingesetzt. Piwik ist mit einem Einsatz auf rund 250.000 Webseiten ein vergleichsweise kleiner Player – der nun ein leistungsstarkes neues Script zur Log-Analyse verspricht, das Urchin als logfilebasierte Auswertung ersetzen soll.

Web-Analytics Piwik
Web-Analytics-Piwik (Foto: Screenshot, Piwik)

Das neue Script und seine Features

Mit dem neuen Script sollen Webserver-Logdateien zu Piwik importiert werden können. Das macht es Webseitenbetreibern möglich, eine große Anzahl an Logdateien einzulesen und unter gewohnter Haube zu analysieren, ohne Piwik in Form von JavaScript-Code auf der eigenen Webseite integrieren zu müssen. Darüber hinaus soll das Script einige praktische Features bieten:

  • Es soll mehrere Millionen Logdateien pro Tag verarbeiten können.
  • Besuche von Bots sollen aus den Logdateien automatisch aussortiert werden, sodass User nur Informationen von „echten“ Website-Besuchern erhalten.
  • Das Tracking per JavaScript und durch den Import von Access-Logs kann kombiniert werden; Webseitenbetreiber können so individuell festlegen, welche Webseiten sie mit welcher Methode tracken möchten.
  • Downloads werden in Piwik automatisch als solche ausgewiesen.

Weitere Features, wie das erneute Verarbeiten der Logdateien, Tracking von Error Codes, Suchmaschinen und Spambots, sind für die Zukunft geplant. Herausgegeben wird das neue Script unter GLP-Lizenz. Die Performance des Scripts soll sich sowohl für Webhoster und Agenturen eignen, die viele Seiten betreiben, wie auch für den Webseitenbetreiber mit einzelnen Internetauftritten. Zwei unterschiedliche Modi machen es möglich, eine beliebige Anzahl an Webseiten automatisch zu Piwiks Analysetool zu importieren.

Besonders als footprintlose Webanalyse sollte man dieses Script unbedingt im Auge behalten. Als kostenlose bzw. kostengünstige Alternative bleibt sonst aktuell nur Piwik über einen „Proxy“ bzw. Subdomains oder Clicky Web Analytics zu verwenden.

2 Antworten zu "Piwik: Web Analytics durch den Import von Webserver-Logdateien"

  1. Das sind ja mal wieder klasse News aus dem Hause Piwik. Hatte mich vor einiger Zeit mit dem Import der Logdateien via Phyton-Scripts versucht, aber es nach mehreren Misserfolgen aufgegeben.

    Danke für die Info, ich werde es nun auf diesem Weg probieren.

    Reply
  2. Darauf habe ich so lange gewartet..
    das ist ein Killer…
    ich habe auch als python-webprogrammierer selbst logfiles in Piwik gepumpt,
    über die WebAPI was aber nicht gerade performant war..
    Die Jungs aus Polen, das python Tool stammt von
    Maciej Zawadziński – http://clearcode.cc/
    haben nun die Logs direkt in Piwik DB gepumpt, ohne HTTP-Umweg,
    die neuere Python Version installieren und dann ran an die alten Logs…

    Was noch fehlt, als i-Punk ist,
    dass man eine Liste Pflegen und einarbeiten lassen kann,
    um Website mit langen Queries, unleserlichen URLs,
    beim import durch sprechende URLs zu ersetzten,
    vielleicht könnte man auch die Titles dazu nutzen…
    dann müsste man aber bestimmten können in Piwik config ob URLs oder Titles angezeigt werden sollen, und URL verlinkt bleiben..

    Reply

Kommentar abschicken