Schlagwort-Archive: statistik

Blogscout: Ranking by Obscurity

von Stefan Evertz am 03.03.07 um 17:34 Uhr |

Vor einigen Wochen hatte ich ja schon kurz über die neue Blogscout-„Topliste“ berichtet, die auf einer „neuen“ und bislang nicht veröffentlichten Formel basierte (siehe auch „Blogscout-Sudoku„).

Dirk Olbertz, der „Macher“ des Blogscout-Dienstes, ist leider kurz danach zurückgerudert (siehe auch blog.blogscout.de):

Ich hab ein wirklich schlechtes Gewissen, weil ich bei der ersten Veröffentlichung der neuen Blog-Topliste versprochen hatte, den Algorithmus nachzureichen.

Inzwischen habe ich ihn ein paar Leuten erklärt, die allesamt positiv auf das Ergebnis und den Weg dahin reagiert haben. Gleichzeitig haben sie aber auch sehr schnell erkannt, wie er manipuliert werden kann. Und da Blogs schon zu sehr unter Kommentar- und Trackback-Spam zu leiden haben, möchte ich nicht noch eine neue Form des Spams hinzufügen. […]

Im Gegensatz zur momentanen Topliste (welche nach der Umstellung in Form einer Top-Reichenweite-Liste weiter bestehen wird), legt die neue Topliste dabei aber mehr Wert darauf, die Blogs weiter oben zu führen, die tatsächlich auch als Blogs in der Blogosphäre wahrgenommen werden.

Auf Anhieb fällt mir da nur eins ein: Schade, Dirk!

Denn so sehr ich Dirks Leistung rund um diesen Dienst respektiere und bewundere, finde ich diese Entscheidung sehr bedauerlich. Ich würde gerne glauben, dass der Algorithmus diejenigen Blogs bevorzugt, die tatsächlich auch als Blogs wahrgenommen werden. Ich kenne aber auch den Spruch „Glaube nur einer Statistik, die du auch selber gefälscht hast“. Und deshalb ist eine solche Topliste ohne eine transparente Formel ohne jeden Wert, denn ich kann die einzelnen Positionen nicht „überprüfen“.

Über den Wert und die Aussagekraft von „Charts“ lässt sich grundsätzlich lang und ausdauern streiten. Seien es die – auf einer vor allem in den USA eingesetzten Toolbar basierenden – Traffic-Werte von Alexa, oder die gerne auch Blogrolls berücksichtigenden Link-Zahlen bei Technorati – allen gemeinsam ist das Problem, dass man schon den Ausgangszahlen mit größter Vorsicht begegnen sollte.

Sobald man aber mit solchen Zahlen nach einer geheimen Formel „weiterrechnet“, ist jedwede Glaubwürdigkeit meines Erachtens endgültig verspielt. Angesichts der bisher ausgesprochen vielversprechenden Bestrebungen von Dirk, mit Blogscout einen ernstzunehmenden „Wegweiser durch die Blogosphäre“ zu etablieren, stellt diese Entscheidung definitiv einen Rückschritt dar.

Ich bezweifle jedenfalls, dass die „Nicht-Veröffentlichung“ der Formel auf Dauer den gewünschten Schutzeffekt gegen Spam haben wird, der ja scheinbar den Hauptgrund für die Verschwiegenheit darstellt. Und das dahinterstehende Verständnis von „Security by Obscurity“ (siehe auch de.wikipedia.org) hätte ich bei Dirk wohl auch nicht erwartet.

Natürlich hätte mich die Formel interessiert. Aber ich werde es wohl noch gerade schaffen, ohne diese Information durchs Leben zu gehen. Und ich werde auch weiterhin den Dienst nutzen, nicht nur wegen der Auswertungen, sondern weil ich die Idee hinter Blogscout gut finde und bislang nichts vergleichbares im Netz entdeckt habe (und z.B. Seitwert in Sachen Transparenz noch diffuser ist , siehe auch Auswertung für dieses Blog unter www.seitwert.de). Aber der Einsatz einer „obskuren Formel“ ist ein erster Schritt zur Neuorientierung 🙁

Kleines Jubiläum

von Stefan Evertz am 25.02.07 um 22:31 Uhr |

Da musste ich doch etwas schmunzeln, als ich heute abend (so gegen 19:13 Uhr) in der laufenden Auswertung meines Besucherzählers Sitemeter stöberte:

Screenshot: Der 333.333 Besucher

Der Besucher Nr. 333.333 (seit dem 18.11.05) kam über Google(.at) und suchte nach „youtube video download“. Ich hoffe nun, dass er unter „Videos von Google und YouTube speichern“ auch ein passendes Jubiläums-Geschenk gefunden hat 😉

Und mir bleibt eigentlich nur noch ein leicht verhustetes „Dankeschön!“ an euch alle, die übrigen 333.332 Besucher und Leser.

Blogscout-Sudoku

von Stefan Evertz am 19.02.07 um 0:24 Uhr |

Bereits im Dezember hatte Dirk Olbertz damit begonnen, die durch seinen Blog-Besucherzähler (counter.blogscout.de) erhobenen Besucherbewegungen auf der Spielwiese (spielwiese.blogscout.de) transparent zu machen (siehe auch blog.blogscout.de):

Für jedes Blog wird die Anzahl der Clicks, die von einem anderen Blog auf dieses Blog gemacht wurden, die Anzahl der unterschiedlichen Links, die dafür genutzt wurden und die Anzahl der unterschiedlichen Blogs, von denen die Clicks kamen, angezeigt. Das gleiche gilt für die andere Richtung, also wieviele Clicks, zu welchen anderen Blogs gingen. Durch Klick auf das [ + ] vor einer Zeile, werden die Informationen über die einzelnen In- und Out-Blogs nachgeladen, zusammen mit der Information, wieviele Clicks über diese Blogs reinkamen oder rausgingen. Die Gesamtliste der Blogs lässt sich durch Click auf die jeweilige Spalte sortieren. Es wird dabei im Moment immer nur absteigend sortiert (größte Zahlen oben).

Warum ich diese Liste so spannend finde? Weil sich dadurch vielleicht eine neue Möglichkeit gibt, Blogs einzuschätzen und sie zu bewerten. Nicht mehr alleine die Anzahl der Links, die von einem Blog ausgehen, oder die bei einem Blog ankommen, ist relevant, sondern doch auch, wie oft so ein Link-Angebot auch genutzt wird.

Insgesamt war es schon damals eine durchaus interessante Spielerei, auch wenn sich aus diesen Zahlen meines Wissens bisher kein neuer „PageRank“-Algorithmus ergeben hat. Als neuesten Wurf lässt Dirk nun täglich eine Top-Liste errechnen (siehe auch blog.blogscout.de[2]):

Unter spielwiese.blogscout.de[2] wird ab sofort eine Top-Liste von Blogs geführt, die nicht mehr auf der Reichweite eines Blogs basiert. Statt dessen werden die Zahlen der Spielwiese verwendet.

Auf welche Art und Weise die Punkte berechnet werden, will ich erst in den nächsten Tagen veröffentlichen, da ich eine eventuell aufkommende Diskussion erst einmal auf die Liste selbst fokussieren möchte.

Ich muss gestehen, dass ich auf die Formel von Dirks Liste wirklich gespannt bin – eine Diskussion der Ergebnisse ohne die Berechnungsdetails halte ich dagegen für schwierig. Ich wundere mich zwar etwas, dass mein kleines Blog aktuell auf Platz 63 liegt. Aber das wird sich wohl nur durch die Formel klären lassen. Und deshalb werde ich wohl warten müssen, bis Dirk die Formel veröffentlicht – meine Versuche des „Reverse Calculating“ waren jedenfalls bisher erfolglos und erinnerten mich an meine Bemühungen bei schwereren Sudoku-Rätseln 🙁

Auf den ersten Blick sehen die Ergebnisse der mittlerweile auf den letzten 7 Tagen basierenden Liste jedenfalls vielversprechend aus. Das allgewaltige Bildblog liegt nur auf Platz 4 und nicht wie sonst – z.B. in den auf Technorati basierenden Deutschen Blogcharts (www.deutscheblogcharts.de) – auf Platz 1. Ich tippe mal, dass bei Dirks Berechnungen die ausgehenden Links – anders als bei den meisten anderen Zählern bzw. Ranglisten – einen höheren Stellenwert haben – oder wird die gesamte Vernetzung (ein- und ausgehend) berücksichtigt?

Sofern sich jedenfalls die Formel als „belastbar“ herausstellt, könnte somit die erste wirklich ernstzunehmende „BlogRang„-Liste entstehen – wenn da nicht die Tatsache wäre, dass die Zahlen nur auf die etwa 2.100 Blogs anwendbar wären, die Dirks Counter benutzen. Aber was ist schon perfekt 😉

Feedburner: Traffic-Daten ausblenden

von Stefan Evertz am 13.01.07 um 17:30 Uhr |

Vor kurzem habe ich berichtet, dass man offensichtlich die Leserzahlen eines RSS-Feeds auslesen kann, sofern dieser über Feedburner läuft (siehe auch „Feedburner: Transparente Traffic-Daten„). Es machte dabei keinen Unterschied, ob die sog. „Awareness-API“ (siehe auch www.feedburner.com; englisch) aktiviert war oder nicht.

So ganz konnte ich aber von diesem Thema nicht lassen, und nach einem netten mehrtägigen Mailwechsel mit Feedburner (Thanks, Eric!) konnten wir – nach mehreren Theorien, die schnell wieder verworfen wurden – eine Lösung für das Problem finden:

Wer nicht möchte, dass die Leserzahlen seines RSS-Feeds durch dritte ausgelesen werden können, muss sowohl die Awareness-API als auch die sog. „FeedCount“-Funktion deaktivieren. Es dauert dann eine gewisse Zeit („gefühlte“ 15-30 Minuten), bis dann die API keine Daten mehr liefert.

So hat es zumindest bei mir mehrfach geklappt, testweise den Zugriff auf meine Traffic-Daten zu sperren, auch wenn ich ja grundsätzlich diese Daten weiter „öffentlich“ lassen will.

Alles in allem ist es zwar schade, dass dieser Zusammenhang aus den – ansonsten eigentlich recht eindeutigen – Texten bei Feedburner nicht deutlich wird. Aber dafür war es immerhin möglich, das Problem im Dialog mit einem Mitglied des Feedburner-Teams zu identifizieren bzw. zu lösen. Davon könnte sich Technorati mal eine dicke Scheibe abschneiden 👿

Zugriffe September / Oktober 2006

von Stefan Evertz am 13.01.07 um 16:38 Uhr |

Da ich doch ein wenig meine Chronisten-Pflicht vernachlässigt habe, gibt es diesmal zwei Monate auf einmal bzw. hintereinander. Die Top 10 der meistgelesenen Artikel habe ich hier erstmals ausgelassen, da mir einfach die Zeit für die zusätzliche Auswertung fehlt. Nur die „erwähnenswerten Artikel“ habe ich beibehalten, da ich diese Liste immer als eine Art komprimiertes Inhaltsverzeichnis des jeweiligen Monats gesehen habe – oder neudeutsch: Die „Highlights“.

Eckdaten September (ermittelt mit counter.blogscout.de):
Zeitraum: 01.09. – 30.09.2006
Besucher (Visits / „V“): 29.007
Seitenabrufe (Impressions / „I“): 44.136
Seitenabrufe / Besucher: 1,52
Ruhigster Tag: 02.09.06 (V: 683 / I: 1.053)
Wildester Tag: 20.09.06 (V: 1190 / I: 1.695)
Tagesdurchschnitt: V: 966 / I: 1.471
Datentransfer: 4.750 MB
Anzahl Beiträge: 26 (Siehe auch September 2006)

Statistik September 2006
Weiterlesen