oder: Was du da sagst und zeigst, das kennen wir schon längst!
Google-Nutzer werden das kennen, dass die Anzeige von Suchergebnissen plötzlich abbricht (obwohl Google angeblich noch weitere Zehntausende Treffer gefunden hat) mit der Bemerkung:
Sie können bei Bedarf die Suche unter Einbeziehung der übersprungenen Ergebnisse wiederholen.
Google hat also eine Ähnlichkeit festgestellt. Was kann damit gemeint sein?
Ich habe z.B. nach “Atomkraftwerk Sicherheit” gesucht. Ein Artikel, der zu begründen versucht, warum unsere Atomkraftwerke sicher sind, wird wahrscheinlich im Wesentlichen die gleichen Stichworte beinhalten, wie ein Aufsatz, der die Sicherheit in Zweifel zieht. Der gravierende Unterschied zwischen beiden Artikeln lässt sich aus mehreren Suchbegriffen allein nicht erkennen, er ergibt sich erst aus dem Zusammenhang, dem Verständnis des jeweiligen Artikels.
Wenn ein Webcrawler diese Texte aber gar nicht wirklich verstehen kann, welche der 100.000 “ähnlichen” Texte (die alle die gleichen Suchbegriffe enthalten) zeigt Google uns dann an?
Da ich diese Frage für die Textsuche nicht beantworten kann, schauen wir uns das Problem am Beispiel der Bildersuche an.



Das erste Bild zeigt einen Ausschnitt der Suche nach allen Bildern von IT-online. Es wurde kein weiterer Suchbegriff eingegeben, damit Google nicht vorher schon weiß, was auf dem Bild zu sehen ist. Rechts unten ist das Bild der Simulation eines Auffahrunfalls zu sehen mit der Google-Aufforderung “Ähnliche Bilder suchen”.
Wenn man hier klickt, erhält man die Anzeige, die im zweiten Bild zu sehen ist. Links oben ist wieder mein Originalbild zu sehen und dann kommen alle “ähnlichen” Bilder. Dieses Ergebnis ist eigentlich voll daneben, denn Google hat offensichtlich nur “rotes Auto” erkannt und weder das Thema Simulation noch den Unfall! Blättert man eine Seite weiter, dann sieht man zwar immer noch keine Simulation, aber immerhin einen Auffahrunfall.
Was bedeutet das nun? Wenn eines der anderen simplen Autobilder auch zu meiner Webseite gehören würde, dann hätte Google bei einer Suche vielleicht immer nur das rote Auto angezeigt und niemals das Bild mit der Unfallsimulation, da Google beide Bilder ja für ähnlich hält.
Damit möchte ich keinesfalls sagen, dass die googlebots oder die nachgeschalteten Analyseprogramme dumm sind. Gerade auf dem Gebiet der Bilderkennung haben KI-Programme enorme Fortschritte gemacht. Die beiden folgenden Bilder geben einen Hinweis, was möglich ist.


Links oben ist jeweils wieder das Originalbild zu sehen und dann kommen die gefundenen ähnlichen Bilder – die Ergebnisse sind beeindruckend! Entweder war hier schon eine sehr intelligente Bilderkennung am Werk oder Google hatte jeweils die richtigen Stichworte in der Datenbank.
Wenn man Pech hat, erhält man aber auch solche Ergebnisse bei der Ähnlichkeitssuche:




Bei diesen Beispielen besteht die Ähnlichkeit bestenfalls aus einer ähnlichen Farbgebung. Inhaltlich haben die meisten angezeigten Bilder mit der Vorlage nichts gemeinsam!
Mir ging es hierbei in erster Linie darum, zu zeigen, wie weit wir bei allen Recherchen im Internet schon abhängig sind von den Ergebnissen intelligenter Programme – von ihren erstaunlichen Fähigkeiten, aber auch von ihren Irrtümern und Grenzen. Und meist werden wir nicht wissen, ob wir gerade ein besonders gutes oder ein miserables, eingeschränktes Suchergebnis erhalten haben.
Bei einer wichtigen Recherche sollte man daher lieber mehrere verschiedene Suchmaschinen befragen und nicht sagen: “Ich hab das gegoogelt, das gibt es nicht!”.






































