Stoppt die Vorratsdatenspeicherung! Jetzt klicken & handeln!Willst du auch bei der Aktion teilnehmen? Hier findest du alle relevanten Infos und Materialien:
home |  einloggen (auch anonym!)
Donnerstag, 28. Juni 2007

Wie rankt eigentlich Google die Ergebnisse der Suchanfragen? Wer bestimmt welche Seite am meisten über Tony Blair weiß? Die tagesschau, die taz, telepolis oder die netzeitung? Also wie legt der Algorithmus der Suchmaschine fest, welche Seiten als erstes aufgelistet werden? Diese Frage hat schon viele beschäftigt - wer die Antwort darauf kennt, kann ein Vermögen verdienen.

Natürlich ist der Mechanismus äußerst kompliziert. Er basiert, wie zur genüge bekannt ist, auf der Vernetzung einer Seite, also wo und wie oft auf sie verwiesen wird, darauf welche Auswahl die Nutzer auf den Ergebnisseiten treffen und einigen weiteren eigentlich recht leicht durchschaubaren Kriterien.

Aber kann schon das der Grund sein, weshalb die Internetsurfer mit Google so zufrieden sind? Warum findet man mit Google Informationen oft schneller als mit anderen Suchmaschinen?

Dazu ein Beispiel. Wir möchten mehr über das Gibbsche Phänomen erfahren. Dazu starten wir zwei Suchanfragen. Einmal bei Google und einmal bei WebCrawler.de. WebCrawler gibt vor, durch Kumulation und Vergleich der Ergebnisse veschiedener großer Suchmaschinen (u.a. Google, Yahoo!, MSN), ein besseres Endresultat zu erzielen.

Suche bei WebCrawler

Suche bei Google

Bei der Betrachtung der Ergebnisse wird deutlich, weshalb Google den Nutzer stärker befriedigt als der Konkurrent - versucht es einmal! Wikipedia hat bei Google eine kategorische Dominanz. Wird ein Suchbegriff angefragt, der einem Stichwort der Wikipedia entspricht, landet diese immer oben.

Das zweite dominante Kriterium bei Google hat mit uns zu tun. Mit den Blogs. Mit Web 2.0. Und dadurch mit Vernetzung. Wer in seinem Blog über etwas spricht, wird von Google sehr hoch eingeschätzt. Beweise? Diese Suchanfrage ist zumindest ein gutes Beispiel. Die ziemlich allgemeine Suchanfrage nach "Anonyme Zahlungsmittel" mit 65.000 Ergebnissen führt direkt auf bitgewitter.blogger.de. Und es kommt noch besser: Wer nach "Zahlungsmittel" sucht, erhält 1.960.000 Ergebnisse. Wir, die kleinen Blogger von bitgewitter, werden mit Position 52 geehrt (Stand 27.6.07).

Ok, könnte ein Einzelfall sein. Wir machen also die Probe aufs Exempel. Tony Blair ist aus dem Amt geschieden. Die Konkurrenz an Artikeln über dieses Thema dürfte also zur Zeit recht hoch sein. Der Titel dieses Artikels "Tony Blair" nun, hat beinahe nichts mit dem Inhalt zu tun. Außer eines: die Suchanfrage "Tony Blair" wird bei Google auf unsere Seite führen. Wetten Dass?

Sind es also wirklich nur zwei Faktoren, die Google zu guten Ergebnissen kommen lassen? Ich sage ja.

... Artikellink  ... kommentieren

 
The Google
Lieber bitwisser,

ein interessanter Artikel - dennoch sind es ziemlich gewagte Thesen, die du da aufstellst :). Schließlich bist du nicht der Erste, der sich über das Thema Gedanken macht. Wie du schon selbst gesagt hast:

Also wie legt der Algorithmus der Suchmaschine fest, welche Seiten als erstes aufgelistet werden? Diese Frage hat schon viele beschäftigt - wer die Antwort darauf kennt, kann ein Vermögen verdienen. [...] Natürlich ist der Mechanismus äußerst kompliziert.

Ein großer Teil des Googlerythmus ist ja auch öffentlich - Stichwort "Google Matrix"; dazu gab es auch einige nicht ganz triviale mathematische Paper. Aber natürlich: es gibt einige unbekannte Faktoren; das bestgehüteste Geheimnis Googles.

Deine Beobachtung, dass bei der Google-Suche Ergebnisse von Wikipedia und aus der Welt der Blogossphäre sehr oft dominierend sind, lässt sich natürlich nicht von der Hand weisen. Dennoch stelle ich in Frage, ob das von Google bewusst so eingebaut ist, oder nicht einfach nur ein Nebeneffekt der Google-Suchstrategie ist: Wie schon von dir beschrieben, spielt für ein gutes Ranking bei Google die Vernetztheit einer Seite eine entscheidende Rolle - und zwar nicht nur, wie viele Seiten mit einem hohen Qualitätswert auf sie linken, sondern auch, welche Qualität die Seiten haben, die bei ihr verlinkt sind. In Sachen Vernetztheit ("digitale Intertextualität") sind Wikipedia und die Blogossphäre gegenüber der Old-School-Internet-Welt unschlagbar - schließlich ist das ein wesentliches Charakteristikum, dass das schöne neue Web 2.0 ausmacht.

Insofern könnte man den Fisch auch von dieser Seite fangen.

LG
ximian

... Link zu dem Kommentar  

 
Fischlein
Natürlich steht hinter google ein ausgefeilter Mechanismus und der steht wie du sagst auch zu großen Teilen offen. Aber was macht den entscheidenden Unterschied aus? Hinter MSN steht auch ein ausgefeilter Mechanismus. Trotzdem ist die durchschnittliche Glücklichkeit ( http://www.keynote.com/company/press_room/releases_2006/01.19.06.html ) der Nutzer von Google höher. Meine These bleibt: der auschlaggebende Faktor dafür, dass die Nutzer mit den Googleergebnissen zufrieden sind, sind die Wikipediaeinträge und die Blogs. Weiter hinten, sind die Ergebnisse von MSN&Co genausogut. Ich halte den psychologischen Faktor, dass man durch das erste Ergebnis (also meis Wikipedia) immerhin eine annehmbare Grundinformation erhält, für Ausschlaggebend.
Was sagst du, wird das Experiment funktionieren? Werden wir unter den ersten 20 bei der Suchanfrage "Tony Blair" sein?

... Link zu dem Kommentar  

 
Fischlein, Fischlein and der Wand
Meine These bleibt: der auschlaggebende Faktor dafür, dass die Nutzer mit den Googleergebnissen zufrieden sind, sind die Wikipediaeinträge und die Blogs. Weiter hinten, sind die Ergebnisse von MSN&Co genausogut.

Ich will auch gar nicht bestreiten, dass das ein ausschlaggebender Faktor ist. Die Frage ist nur - ich wiederhole mich: Ist Google so gut, weil Wikipedia und Blogs vorne sind oder sind Wikpedia und Blogs vorne, weil Google so gut ist? :)

Ein Gegenargument wäre: Wikipedia ist nicht immer vorne. Beispiel: zu "Stasi 2.0" existiert ein Wikipedia-Artikel, doch gibt man es bei Google ein, ist der erste Treffer in Wikipedia an Stelle 491 - und es ist nicht der Stasi-2.0-Artikel, sondern der zu Wolfgang Schäuble :) (Stand: 05.07.2007). Unter den ersten 630 Treffern von ungefähr 266.000 ist es auch nicht, und um mir "nur die treffendsten Ergebnisse anzuzeigen, wurden einige Einträge ausgelassen, die den 630 bereits angezeigten Treffern sehr ähnlich sind." - so Google. Dennoch heißt das natürlich nicht, dass Google Wikipedia und Blogs nicht doch bewusst pusht.

Anyway, ich denke, dass noch mindestens zwei weitere Faktoren dazu kommen, dass Google so beliebt ist:
  1. Google waren die Ersten, die begriffen haben, dass eine schlichte Startseite mit fast nur dem Suchbalken darauf etwas äußerst Anziehendes hat. Nach wie vor sind Yahoo und MSN - was ich überhaupt nicht verstehen kann - von oben bis unten mit Werbung, Artikeln, die keiner sehen will, et cetera pp zugekleistert.

  2. Google ist sauschnell. Und warum ist Google so schnell? Weil Google technisch so gut ist :).
Doch wie machen die das? Hierfür kann ich folgende Gründe ausmachen:
  1. Sie waren die Ersten mit dem Schlichte-Seite-Konzept und konnten in ungeheuer kurzer Zeit ein riesiges Monopol aufbauen und haben dadurch einen technischen und finanziellen Vorprung, den man nicht so schnell wieder aufholen kann.

  2. Sie wissen den "Open-Source-Effekt" für sich zu nutzen, z.B. mit dem Summer of Code: Sie stellen durch Geld, Serverplatz und Manpower Spielwiesen für Hacker bereit, die sich da richtig austoben können. Aus denen können sie sich die Besten herauspicken. Ich denke, das ist nicht zu unterschätzen, da wie sich jemand in der Praxis so macht IMHO mehr über die Qualität einer Arbeitskraft aussagt als alle Zeugnisnoten, Abschlussberichte, Bewerbungen und Vorstellungsgespräche zusammen.
Was sagst du, wird das Experiment funktionieren? Werden wir unter den ersten 20 bei der Suchanfrage "Tony Blair" sein?

Keine Ahnung, ich würde es natürlich hoffen :) aber momentan sieht es eher nicht so aus :(. Vielleicht dauert das noch, vielleicht ist aber "Tony Blair" auch doch ein zu allgemeines "Fundwort" :O

... Link zu dem Kommentar  

 
Aktuelle Google Position
Ok, hier ein erster Zwischenstand :)

Bei der Suchanfrage "tony blair blog" ist der Artikel mittlerweile auf Position 559. Ich befürchte, das wird noch ein hartes rennen .... lol

http://www.google.de/ie?q=tony%20blair%20blog&num=100&hl=de&lr=&start=500&sa=N

... Link zu dem Kommentar  

 
Nachtrag
Es sieht nicht gut aus:

Der Artikel ist inzwischen bei Google gelistet - wird aber zumindest unter dem Stichwort "Tony Blair" nicht gefunden. Experiment gescheitert! :(

Ach ja. Ein wesentliches Kriterium, warum es für alle anderen gegen Google so schwer ist, hatte ich in meinen Postings oben noch vergessen: Unschärfe. Google schafft es inzwischen bemerkenswert gut, Grundzüge des Inhalts eines Suchausdrucks zu analysieren. Gibst du zum Beispiel als Fundwort "gehen" ein, so wird auch nach "Gang", "gegangen" usw. gesucht. Auch wenn das gewiss noch nicht als "semantisch intelligente Suche" bezeichnet werden kann, so ist unser Google auch in diesem Punkt allen anderen weit überlegen - leider.

... Link zu dem Kommentar  


To prevent spam abuse referrers and backlinks are displayed using client-side JavaScript code. Thus, you should enable the option to execute JavaScript code in your browser. Otherwise you will only see this information.

Feed
Letzte Aktualisierung:
21. September, 18:42

 RSS abbonieren
Artikel
Neueste Kommentare
Mehr Widerstand braucht...
Moin, moin, ihr anonymen Blogger und deren Leser! ;-) Damit...
by kommentator_pm8jnl65 (21. September, 18:42)
hattest noch glück
Du kannst ja froh sein, dass dir die Festplatte beim...
by kommentator_pm8jnl65 (18. Dezember, 13:09)
Die SteuerID im Briefkasten?...
Hier gibts es einen interessanten Artikel der Humanistischen...
by kommentator_pm8jnl65 (10. Juni, 00:42)
Hosting
ihr könnt die CD bei http://offsystem.sf.net...
by kommentator_pm8jnl65 (2. Juni, 02:41)
Hallo, ich brauche für...
Hallo, ich brauche für eine Semesterarbeit noch...
by umfrage-janine (26. Mai, 17:36)
Menu
Kalender
Juni 2007
Mo
Di
Mi
Do
Fr
Sa
So
 
 
 
 
 1 
 2 
 3 
 4 
 5 
 6 
 7 
 8 
 9 
10
11
12
13
15
16
17
21
22
23
24
25
26
29
30
 
 
 
Blogroll
Anonym?
IP
Wichtig






Gebannt
























Please sign the EC Open Access Petition in support of the European Commission's proposed Open Access Self-Archiving Mandate








Join the Blue Ribbon Online Free Speech Campaign






Meta

Deutsches Blog Verzeichnis




made with antville

nach oben |  startseite |  kategorien |  impressum |  galerie