Lade Inhalt...

Buy what you see - everywhere: Welche Möglichkeiten bietet die grafische Mustererkennung zur Verbesserung der Online-Produktsuche?

©2012 Bachelorarbeit 74 Seiten

Zusammenfassung

Eine Welt ohne Suchmaschinen ist für die meisten - am technologischen Fortschritt teilhabenden Menschen - nicht mehr vorstellbar. Die Entwicklung der Suchmaschinen schreitet, bei gleichzeitig steigenden, verfügbaren Informationsmengen, immer weiter voran. Doch eines hat sich bis heute nicht verändert: Primär „schreiben“ wir seit über 20 Jahren Suchbegriffe, nach denen das World Wide Web durchsucht werden soll.
Diese Einschränkung hält eine bequeme Möglichkeit der Suchmaschinennutzung von der Ausbreitung auf mobile Endgeräte ab. Könnte die Eingabe der Suchmotive einfacher, beispielsweise auch visuell - mit einem Foto von einem Smartphone oder vielleicht sogar mit einer Brille à la „Google Project Glass“ - erfolgen, würde die bereits vorhandene Vernetzung mit dem Internet in einer neuen, vielversprechenden Form zur Verfügung stehen.
Die unmittelbare Verarbeitung der visuellen Daten kann am folgenden Beispiel verdeutlicht werden: Man sieht ein Fahrrad und macht davon ein Foto, woraufhin sämtliche Online-Shops nach dem Produktfoto durchsucht und die Ergebnisse der Online- und herkömmlichen Fahrradshops aufgezeigt werden. Zusätzlich werden z. B. die Positionen der Fahrradshops auf einer Umgebungskarte mit entsprechenden Navigationsvorschlägen angeboten. Weitere Dienste, wie z. B. Produktrating, werden naturgemäß Verwendung finden, sobald der Medienbruch überwunden ist. Die Technologie zur Überwindung dieses Medienbruchs zwischen visueller, grafischer Eingabe und der konventionellen Internetsuche ist der zentrale, auf neuronalen Netzen basierende Schwerpunkt dieses Buches.

Leseprobe

Inhaltsverzeichnis


Abkürzungen
ADALINE . . . . . . . Adaptive Linear Neuron: Erstes kommerziell genutztes KNN-
System.
App . . . . . . . . . . . . . . . Application: Umgangssprachliche Bezeichnung für eine Soft-
ware eines mobilen Endgerätes
ARPANET . . . . . . Advanced Research Projects Agency Network
ATP . . . . . . . . . . . . . . Adenosintriphosphat
DNS . . . . . . . . . . . . . . Desoxyribonukleinsäure
EVA . . . . . . . . . . . . . . Eingabe Verarbeitung Ausgabe
IBM . . . . . . . . . . . . . . International Business Machines Corporation
IT . . . . . . . . . . . . . . . . . Informationstechnologie
KI . . . . . . . . . . . . . . . . Künstliche Intelligenz, in der Literatur oft auch als Artificial
Intelligence (AI) bezeichnet
KNN . . . . . . . . . . . . . Künstliche Neuronale Netze
MIT . . . . . . . . . . . . . . Massachusetts Institute of Technology
MTOC . . . . . . . . . . . Microtubule Organizing Center
PC . . . . . . . . . . . . . . . . Personal Computer
RNA . . . . . . . . . . . . . Ribonukleinsäure
SOM . . . . . . . . . . . . . Self-Organizing Maps
SSN . . . . . . . . . . . . . . Spiking Neural Networks
URL . . . . . . . . . . . . . . ,,Uniform Resource Locator" - ist eine einheitliche Anzeige für
Quellen der Web-Inhalte
WWW . . . . . . . . . . . World-Wide-Web: Englisch für Weltweites Netz, Synonym In-
ternet
XOR . . . . . . . . . . . . . . Ein logischer Operator, der ein ,,exklusives oder", d.h. ein
,,entweder oder" darstellt

Abbildungen
1
Schematische Darstellung der Suchmaschinentypen; (Links) Meta-
suchmaschine; (Rechts) Suchmaschine . . . . . . . . . . . . . . . . . .
6
2
Schematischer Aufbau einer tierischen Zelle . . . . . . . . . . . . . . . 15
3
Schematische Darstellung eines Neurons
. . . . . . . . . . . . . . . . 16
4
Neuronentypen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
5
Chemische Synapse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
6
Aktionspotenzialkurve . . . . . . . . . . . . . . . . . . . . . . . . . . 23
7
Schematische
Darstellung
eines
künstlichen
Neurons;
(Links)
McCulloch-Pitts-Zelle; (Rechts) Biologische Zelle
. . . . . . . . . . . 28
8
(Links) Schematische Darstellung eines künstlichen Neurons; (Rechts)
Implementierung im Pseudocode
. . . . . . . . . . . . . . . . . . . . 29
9
Schematische Darstellung der Aktivierungsfunktion: X-Achse Aktivi-
tätslevel; Y-Achse Netzinput . . . . . . . . . . . . . . . . . . . . . . . 31
10
Feedforward-Netz mit typischen Units Inputlayer = {1,2,3} Hidden-
layer = {4,5} Biasneuron= {6} Outputlayer= {7,8,9} . . . . . . . . . 35
11
Arten der Netzkopplung . . . . . . . . . . . . . . . . . . . . . . . . . 36
12
Schematische Darstellung der Hebbschen Lernregel
. . . . . . . . . . 38
13
Beispiel einer Gesichtsmusterkarte . . . . . . . . . . . . . . . . . . . . 44
14
Schematische Darstellung einer grafischen Ergänzung der Online-
Produktsuche; (Links) Mit eigenentwickelten KNN; (Rechts) Mit vor-
handenen Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

Tabellen
1
Top 10 - Produktsuchmaschinen - ohne Google-Shopping . . . . . . . 10

1
Einleitung
1.1
Einleitende Worte
Die Suchmaschinen haben unseren Zugriff auf die globalisierte Informationswelt re-
volutioniert. Private wie kommerzielle Nutzung ist alltäglich, für viele sogar unver-
zichtbar geworden. Beinahe alle in Bits und Bytes zerlegbaren Informationen können
heute über das global vernetzte Internet von fast jedem Ort und zu jeder Zeit auf-
gerufen werden.
Auch, wenn heutige Standards der Informationsbereitstellung in der Menschheitsge-
schichte etwas noch nie Vorhandenes darstellen, so ist deren Entwicklungsprozess bei
Weitem noch nicht abgeschlossen. Die Komplexität, die durch den individuellen Kon-
text jeder einzelnen Suche bedingt ist, steigt mit zunehmender, globaler Dimension
der zu durchsuchenden Informationsmenge an. Die Innovation der Suchverfahren
muss also - mit den Bedürfnissen der Nutzer, dem Stand der Technik und der An-
gebotssituation - Schritt halten, um die erwartete Ergebnisqualität zu sichern und
langfristig zu verbessern. Hierzu ist es unerlässlich, kontinuierlich alternative Wege
zu erforschen und neue Modelle zu entwickeln.
Eine dieser Alternativen kann z.B. der Ansatz einer grafischen anstelle einer rein
textbasierten Suche sein. Eine ausgereifte Ausführung dieses Verfahrens kann in
ihrer kommerziellen Tragweite die nächste evolutionäre Entwicklungsstufe für den
ohnehin stetig an Bedeutung gewinnenden Onlinehandel bedeuten (siehe auch Ka-
pitel 2.2.3: ,,Chancen der Erweiterung" unter ,,Studie Social Commerce 2012").
Diesen neuen Herausforderungen des Informationszeitalters, das aufgrund globalen
Wachstums und stetig steigender Vernetzung zum komplexesten von Menschen ge-
schaffenen System
1
anwächst, kann mit Lösungen aus der Erforschung des besten,
bisher bekannten, biologischen Informationsverarbeitungssystems - dem menschli-
chen Gehirn - begegnet werden.
2
Der medizinisch-technische Fortschritt versetzt uns heute in die Lage, hochkomplexe
und in Jahrmillionen der Auslese optimierte, Vorbilder aus der Natur zu suchen, zu
verstehen und technisch zu realisieren. Neuroinformatiker sind daher bemüht, er-
1
Vgl. Prof. Dr.-Ing. Matthias Hollick - Allgemeine Informatik 1 (2012)
2
Vgl. http://www.3sat.de - Komplexität in der Hirnforschung (2008)
1

worbene Erkenntnisse aus der Hirnforschung zur Optimierung bestehender Systeme
der Informationstechnologie (IT) zu nutzen. Dazu wird unter anderem das Muste-
rerkennungsprinzip der künstlichen neuronalen Netze (KNN) verwendet.
Neuronale Netze bieten, dank ihrer von klassischer IT abweichenden Eigenschaften,
neuartige Lösungskonzepte und Einsatzmöglichkeiten. Sie begleiten uns bereits täg-
lich in Form von Mustererkennungssystemen bei Kameras unserer Mobilfunkgeräte
bis hin zu Anlagestrategien unserer Investmentfonds.
1.2
Ziel der Arbeit
Zwecks Strukturierung der Arbeit wurden im Titel definierte Schwerpunkte zu Fra-
gestellungen abgeleitet, die im Zuge dieser Arbeit erörtert und nach Möglichkeit
beantwortet werden sollen. Diese lauten wie folgt:
,,Neuronale Netze. . . Wie werden die, in ihrem Aufbau, ihrer Verarbeitungs- und
Speicherungslogik hochgradig unterschiedlichen Systeme der Biologie und der
IT zusammengeführt, sodass die erwünschten Eigenschaften des biologischen
Systems durch eine IT-Lösung genutzt werden können?
. . . zur grafischen Mustererkennung. . . Welchen Aufbau und welche Organisa-
tion muss ein auf KNN basierendes System aufweisen, um die zur Fähigkeit
grafischer Mustererkennung notwendigen Verarbeitungsschritte abzubilden?
. . . bei der Online-Produktsuche" Welche Möglichkeiten bietet die grafische
Mustererkennung zur Verbesserung der Online-Produktsuche?
2

1.3
Abgrenzung
Die drei Themen sind im Einzelnen nicht neu und wurden bereits in anderen wissen-
schaftlichen Arbeiten behandelt. Meine Literaturrecherche ergab jedoch, dass deren
Zusammensetzung in der vorliegenden Form noch nicht betrachtet wurde.
Durch die Zusammenlegung der drei Themen kann und soll nicht die gleiche fach-
liche Tiefe, wie bei einer Einzelbetrachtung, erreicht werden. Des Weiteren wirken
sich formale Einschränkungen der Bachelorthesis nicht nur auf die Ausführlichkeit
der Behandlung der einzelnen Themen, sondern auch auf die Bezugnahme zu ver-
wandten Themen aus. Dadurch können einige Gesichtspunkte, je nach thematischer
Relevanz, nur eingegrenzt, andere gar nicht in die Arbeit eingehen. Folgende Themen
wurden, aus genannten Gründen, nicht oder nur stark eingeschränkt behandelt:
· Die Arbeit befasst sich ausschließlich mit grafischen Mustererkennungsmodel-
len auf der Basis von KNN. Andere Konzepte, wie Fuzzy Systeme etc. sind für
diese Ausarbeitung nicht relevant.
· Statt der eigenständigen Entwicklung eines Prototypen sollen vielmehr die
theoretischen Grundlagen chronologisch und unter Berücksichtigung der Rele-
vanz vorgestellt und mögliche Optimierungsszenarien aufgezeigt werden.
· Bestehende Lösungen werden als solche in angemessenem Umfang vorgestellt,
wobei tiefer gehende Betrachtungen der einzelnen möglichen Entwicklungssze-
narien nicht im Fokus dieser Arbeit stehen.
· Die vielfältigen Möglichkeiten und Chancen des Verfahrens eröffnen ungeahn-
te Kombinationsmöglichkeiten in vielen Bereichen und Technologien. Über-
schneidungen mit Themen wie Augment Reality, Überwachung (z.B. Echtzeit-
personenverfolgung in videoüberwachten öffentlichen Räumen) etc. konnten in
diesem Umfang jedoch nicht berücksichtigt werden.
· Aus dem Bereich der künstlichen Intelligenz (KI) wird ausschließlich der Teil-
bereich der KNN betrachtet.
· Das Thema der Verantwortung bei Suchmaschinen für gefundene Inhalte ist
nicht unumstritten, denn die Regierungen der Länder können gezielt Ein-
3

fluss darauf nehmen, welche bestimmten Inhalte nicht gefunden werden sollen.
Die damit verbundene Zensurunterstellung sowie das kritische Hinterfragen
des Suchmaschinen-Quasimonopols werden in dieser Arbeit den eigentlichen
Schwerpunkten weichen.
· Obwohl das Thema der Preisgabe persönlicher Daten im Internet auch für die
Online-Produktsuche relevant ist, wird es nicht weiter kritisch erörtert.
1.4
Aufbau der Arbeit
Zu Beginn wird ein allgemeiner Überblick über die Themenschwerpunkte, Leitfragen
und den Aufbau der Arbeit gegeben.
Das folgende Kapitel befasst sich mit dem aktuellen Stand der Online-Produktsuche.
In diesem Zusammenhang werden verschiedene Typen und Funktionsweisen von
Suchmaschinen sowie aktuelle Möglichkeiten einer Grafiksuche vorgestellt. Anschlie-
ßend erfolgt die Betrachtung der Produktsuchmaschinen unter Berücksichtigung der
Optimierungsidee durch grafische Mustererkennung.
Der Aufbau und die Funktionsweise der neuronalen Netze ist das Thema des nächs-
ten Kapitels, wobei erst die biologische und anschließend die technische Sicht erläu-
tert wird. Hierbei werden die biologischen und künstlichen Neurone, als wesentliche
Bestandteile von neuronalen Netzen, ausführlich beleuchtet. Das Kapitel der Mus-
tererkennung befasst sich mit der visuellen Mustererkennung beim Menschen sowie
ihrer technischen Realisierung durch künstliche neuronale Netze.
Nach der Betrachtung der Grundlagen widmet sich ein Kapitel der Vorstellung von
möglichen Lösungsansätzen, gefolgt von einer kritischen Betrachtung des Themas.
Abschließend wird ein persönliches Fazit formuliert, gefolgt wird es von einem Aus-
blick auf die zukünftigen Einsatzmöglichkeiten und Potenziale der KNN sowie der
Online-Produktsuche.
4

2
Aktueller Stand der Produktsuche im Internet
Im folgenden Kapitel wird der aktuelle Stand zur Entwicklung, Funktionsweise und
zu Typen von Suchmaschinen, gefolgt vom Konzept der Produktsuchmaschine, dar-
gelegt.
2.1
Suchmaschine
Eine Suchmaschine ist in erster Linie ein Programm, das mithilfe eines entspre-
chenden Suchalgorithmus in der Lage ist, aus einem Suchraum (einer Menge von
Elementen) Elemente mit bestimmten Eigenschaften zu identifizieren.
3
2.1.1
Typen von Suchmaschinen
Ähnlich einem Bibliothekar, bedienen sich heute die meisten Web-Suchmaschinen
eines Indizes oder eines Verzeichnisses, in dem meist hierarchisch die Suchbegrif-
fe mit passenden Links zu den Inhalten verknüpft abgelegt sind. Somit geschieht
die eigentliche Suche nicht im Web, sondern auf dem weitaus kleineren Index. Die
gängigsten Arten der Suchmaschinen werden im weiteren Verlauf dargestellt:
Verzeichnisse sind Webkataloge, die entweder hierarchisch oder netzwerkartig or-
ganisierte Sammlungen von Lesezeichen enthalten (einer der ersten und heute
noch existierenden Vertreter ist www.Yahoo.com). Die Lesezeichen werden von
Menschen eingetragen, redaktionell geprüft und oftmals bewertet.
4
Das sichert
zwar eine gewisse Qualität, hat jedoch hohe Personalkosten und oft veraltete
Inhalte zum Nachteil.
Suchmaschinen nutzen für die Indexerstellung sogenannte Web-Crawler (spezielle
Programme), welche anhand von Uniform Ressource Locator (URL) das Inter-
net durchsuchen. Dazu lesen, analysieren und bewerten sie anhand bestimm-
ter Schlüsselwörter und Kriterien voll automatisiert die Web-Dokumente. Die
3
Vgl. Heinrich, Jana (2010), S. 32
4
Vgl. SEO-Suchmaschinenkompetenz.pdf (2008), S. 11
5

Ergebnisse werden nach mehreren Verarbeitungsschritten, der Datenextrak-
tion und -kompression, nach bestimmten Kriterien in die Indexstruktur der
Suchmaschine integriert. Ihr Vorteil ist, dass sie - verglichen mit manueller
Verzeichnispflege - sehr kostengünstig und inhaltlich stets aktuell sind. Goo-
gle gehörte mit 81%
5
des Marktanteils zu den bekanntesten indexbasierten
Suchmaschinen. Ab Mai 2012 beginnt eine stufenweise Umstellung auf eine se-
mantische Infrastruktur der Suchmaschine, welche nach Google mehrere Jahre
andauern wird. Welche Form der Datenhaltung zukünftig die Referenzbasis
für Suchanfragen bilden wird, ist zurzeit noch unklar.
6
Eigene Darstellung nach: Metasuchmaschine - meta search engine - ITWissen.pdf
Abbildung 1:
Schematische
Darstellung
der
Suchmaschinentypen;
(Links) Metasuchmaschine; (Rechts) Suchmaschine
Metasuchmaschinen (siehe Abbildung (1)
7
: ,,Schematische Darstellung der Such-
maschinentypen") nutzen andere Suchmaschinen als Basis für ihre Suche, die
Zwischenergebnisse werden - nach eigenen Algorithmen - optimiert und auf-
bereitet präsentiert. Ihr Vorteil besteht darin, dass sie ein möglichst breites
Spektrum an Inhalten für die Verarbeitung der Suchanfrage abgreifen können.
Dies begründet sich darin, dass die Suchmaschinen nur einen Anteil des World-
Wide-Webs (WWW) erfassen und jede Suchmaschine, durch unterschiedli-
che Algorithmen und Verfahren, möglicherweise unterschiedliche Bereiche des
Webs im Zugriff hat.
5
Vgl. webhits internet design gmbh - Web-Barometer.pdf (2012), S. 4
6
Vgl. http://pdf.zeit.de/digital/internet/2012-03/google-semantische-suche.pdf (2012), S. 1 f.
7
Vgl. Metasuchmaschine - meta search engine - ITWissen.pdf (2011), S. 1.
6

Als Beispiel kann http://www.yasni.de, als eine der meistbesuchten Meta-
Personen-Suchmaschinen in Deutschland aufgeführt werden.
8
Semantische Suchmaschinen (von Semantik = Lehre von der Bedeutung der
Zeichen) werden, zusammen mit dem semantischen Web, als die nächste Ent-
wicklungsebene des Internets gesehen. Dahinter verbirgt sich die Idee, Maschi-
nen die Fähigkeit zu geben, die von Menschen zusammengetragenen Informa-
tionen mithilfe der Semantik sinnvoll verknüpfen und verstehen zu können.
Das Ziel ist im nächsten Schritt, die Fragestellungen der Menschen richtig zu
deuten und zutreffende Antworten in ausformulierter Sprache zu liefern.
9
Au-
ßer der bereits erwähnten Umstellung von Google können noch zwei weitere
Beispiele für semantische Suche genannt werden. Zum einen ist es die, für
wissenschaftliche Fragestellungen optimierte, englischsprachige Suchmaschi-
ne http://www.wolframalpha.com und zum anderen eine mobile Wikipedia
Android-Applikation (App). Dazu ein Auszug aus der Beschreibung:
,,Sprechen Sie Ihre Frage in die App und bekommen Sie schnell die
exakte Antwort von Wikipedia! ... Man spricht: ,,Wann wurde Ein-
stein geboren?" direkt in das Telefon und bekommt exakt die Ant-
wort ,,14. März 1879" auf den Bildschirm."
10
Weitere Suchmaschinen stellen verschiedene Hybridformen der oben genann-
ten Typen sowie die sogenannten Verteilte- oder auch Peer-To-Peer-
Suchmaschinen vor, wie z.B. http://www.yacy.net. Hierbei handelt es sich um
eine Suchmaschinensoftware, die jeder Benutzer auf seinem Personal Compu-
ter (PC) installieren kann. Die Software operiert dezentral und bei Bedarf
sogar autonom mittels eigen erstellten, lokalen Indizes, welche sie anderen
Mitgliedern zur Verfügung stellt. Es erfolgt keine zentrale Speicherung von
Benutzerverhalten etc. und das dezentrale Konzept macht eine (auf einzelne
Länder beschränkte) Zensur im WWW unmöglich.
11
8
Vgl. Metasuchmaschinen - Liste, Übersicht Metasuchmaschinen.pdf (2012), S. 2
9
Vgl. Dengel, Andreas (2011), S. 232
10
AskWiki - Spracherkennung - Android Apps auf Google Play.pdf (2012), S. 1
11
Vgl. YaCy - Freie Suchmaschinensoftware und dezentrale Websuche.pdf (2011), S. 1-3
7

Das folgende Beispiel soll das Vorgehen und die Bedeutung der Extraktion von re-
levanten Informationen aus der Suchanfrage sowie ihre Bewertung und das Ranking
der im Index vorgefundenen Treffer von.
12
Dafür wird die Suchanfrage z.B. (Mustererkenung mit küstlichen neuroalen Netzen)
in folgenden Teilschritten abgearbeitet und anschließend ausgegeben:
1. Korrektur der Rechtschreibfehler und Vertipper
(Mustererkennung mit künstlichen neuronalen Netzen)
2. Trennung in einzelne Wortbestandteile
(Muster, Erkennung, künstlich, Neuron, neuronal, Netze, usw.),
3. Ergänzung durch Synonyme
(Muster = (Plan, Design, Idealbild), ... Neuron = (Nervenzelle), usw.)
4. evtl. Ergänzung durch ins Englische übersetzte Begriffe
(Mustererkennung = pattern matching, Netz = network, usw.)
5. Formulierung neuer Suchanfragen aus extrahierter Informationsmenge
6. evtl. Berücksichtigung weiterer Rankingkriterien, wie die Gewichtung der
Quelle (z.B. www.wikipedia.de +1; www.bild.de hingegen -1) usw.
7. Ergebnisse nach Grad der Übereinstimmung mit der Suchanfrage sortieren
8. Duplikate herausfiltern
9. evtl. mit einer Blacklist (eine Liste zensierter Inhalte) abgleichen
10. evtl. thematisch gruppieren
2.1.2
Aktuelle Suchoptionen für Grafiken
Seit wenigen Jahren besteht die Möglichkeit online gestellte Grafiken, also auch Pro-
duktfotos, rückwärts zu suchen. Rückwärts meint an dieser Stelle: Von der Grafik
zur Information und nicht umgekehrt.
12
Vgl. Tremel Andreas.pdf (2010), S. 18 f., 20 f., 44 f.
8

Die Bildersuche der beiden Anbieter Google & TinEye
13
wird im Internet gefei-
ert und gefürchtet, denn die Plagiatsskandale der letzten Jahre und Wochen lassen
Konsequenzen aus der neuen Suchfunktion erahnen.
14
Beide Konzepte sind zwar
unabhängig voneinander entwickelt worden, bieten jedoch sehr ähnliche Funktiona-
litäten. Analog zur bekannten Textsuche bei Google wird ein Suchkriterium in Form
eines beliebigen Fotos hochgeladen bzw. aus dem Web verlinkt.
15
Danach wird das
Web mit speziellen Mustererkennungsalgorithmen nach ähnlichen Bildern durch-
sucht. Aus dem ersten Suchlauf werden Bildüberschriften, Beschreibungen usw. se-
pariert und im Folgeschritt in einer gewöhnlichen Internetbildersuche verwendet. Die
Ergebnisse der beiden Suchläufe werden nach Grad der Übereinstimmung und Bild-
qualität sortiert und als Suchresultate präsentiert. Mit Plug-ins für Firefox können
beliebige Bilder aus dem Internet gesucht werden (rechten Mausklick auf das Bild,
dann auf ,,Search Image on TinEye" bzw. ,,Search Image on Google"). Die Bildersu-
che ist zwar von jeder beliebigen Webseite, also auch aus einem Onlineshop möglich,
das Ergebnis bietet jedoch keine weiteren funktionalen Kategorisierungsmöglichkei-
ten. Lediglich bei der Google-Suche bietet das Umschalten auf Google-Shopping -
auf den ersten Blick - eine Möglichkeit, das Ergebnis der Bildersuche mit einem On-
lineshop zu verknüpfen. In Wirklichkeit wird lediglich eine Google-Shopping-Suche
mit der am häufigsten vorkommenden Überschrift des zuvor gesuchten Bildes durch-
geführt.
2.2
Produktsuchmaschinen
2.2.1
Definition und aktueller Entwicklungsstand
Eine Produktsuchmaschine ist eine auf Produktdatenbanken optimierte Suchmaschi-
ne, die entweder lokal oder online (implizit auch mobil) eine oder mehrere Daten-
banken durchsucht. Produktsuchmaschinen werden u.a. von Vergleichsportalen, wie
http://www.ciao.de und http://www.billiger.de verwendet. Dabei handelt es sich
um Internetseiten, die, ähnlich einer Meta-Suchmaschine, die Suche über mehrere
13
Vgl. TinEye - Rückwärtssuche für Bilder.df (2010), S. 1 f.
14
Vgl. Guttenbergs Plagiatsaffäre - SPIEGEL ONLINE - Nachrichten.pdf (2012), S. 1 f.
15
Vgl. Vergleichende Bildersuche mit Google (2011)
9

Rang
Name
Rang
Name
1
http://de.shopping.com
2
http://www.shopzilla.de
3
http://www.idealo.de
4
http://www.ladenzeile.de
5
http://www.guenstiger.de
6
http://www.preisroboter.de
7
http://www.billiger.de
8
http://www.nextag.de
9
http://www.ciao.de
10
http://www.dooyoo.de
Tabelle 1:
Top 10 - Produktsuchmaschinen - ohne Google-Shopping
Onlineshops durchführen (siehe auch Tabelle: ,,Top 10 - Produktsuchmaschinen"
16
).
Ein Onlineshop ist eine, mit einer Produktdatenbank, einem Internetauftritt, ei-
nem Warenkorb und einer Bezahlfunktion versehene Software. Demnach werden
die Produktdatenbanken, beziehungsweise ihre auf die Produkte verweisenden Ver-
zeichnisse oder Indizes der jeweiligen Onlineshops durchsucht. Die Vorteile eines
Vergleichsportals sind i.d.R. die anbieterunabhängige Angebotssuche und die Be-
reitstellung vielfältiger Filterfunktionen sowie ein übersichtlicher Aufbau der Er-
gebnisse. Auch, wenn die Verbraucherschützer davor warnen den Ergebnissen der
Vergleichsportale blind zu vertrauen, so werden ihre Dienste dennoch gerne ge-
nutzt.
17
Bei den meisten Vergleichsportalen handelt es sich um sogenannte ,,White-
Label-Preisvergleichsportale". Dazu zählen zum Beispiel auch solche Giganten, wie
http://www.ebay.de und http://www.amazon.de, welche die Suche nicht auf den Da-
tenbanken der Anbieter, sondern auf den hauseigenen durchführen.
18
Die Anbieter
der Produkte stellen zuvor ihr Sortiment in deren Datenbanken ein und stellen sich
somit der Angebotstransparenz und der dadurch bedingten gestiegenen Konkurrenz.
2.2.2
Mobile-Shopping
Mobile-Commerce ist der Überbegriff, welcher die gesamte mobile Optionspalette
des Handels abdeckt. Mobile-Shopping hingegen bezieht sich auf den tatsächlichen
Produktkauf mit eventuell vorausgegangener Produktsuche und -recherche etc. Die
Grundvoraussetzungen hierfür, wie ein flächendeckender, preiswerter mobiler Inter-
netzugang, Endgeräte mit angemessenem Display zur Produktanzeige und Zugang
zu Onlineshops, sind seit wenigen Jahren in nennenswertem Ausmaß vorhanden. Der
Mobile-Shopping-Markt wächst mit der verfügbaren Technik, wie folgender Vergleich
16
Vgl. www.marketing-trendinformationen.de - eResult-top-10-produktsuchmaschinen (2012)
17
Vgl. Süddeutsche - Vergleichsportale im Internet - Helfer, die ratlos machen (2011)
18
Vgl. www.finanztip.de (2012)
10

verdeutlicht: 2010 betrieben 1,8 Mio. Menschen in Deutschland Mobile-Shopping mit
einem Smartphone, 2011 waren es hingegen bereits 3,8 Mio. Dies stellt mehr als ei-
ne Verdopplung innerhalb von nur einen Jahres dar. Dabei bieten die Smartphones
nicht nur immer bessere Möglichkeiten des Mobile-Shopping an, sondern sie nehmen
auch in ihrer Anzahl, von 20 Mio. zu Beginn des Jahres 2012 bis zu geschätzten 35
Mio. bis Ende des Jahres, stetig zu.
19
2.2.3
Chancen der Erweiterung
Die Einstellung der Gesellschaft zum Zugang, dem Umgang und der permanenten
Verfügbarkeit von Informationen ist einem, beinahe alle Generationen durchziehen-
den, Wandel unterzogen. Hinzu kommt die, trotz Aufklärung und regelmäßig auf-
gedeckten Datenpannen, steigende Bereitschaft der Bürger, persönliche Daten und
Gewohnheiten online preiszugeben. Viele Informationen sind demnach ganz legal
verfügbar und können einen Aufschluss über das Kaufverhalten einzelner Personen
ermöglichen. Das Zusammenspiel aus dem Konsumentenwissen über das neue Me-
dium sowie dem im Medium vorhandenen Wissen über den Konsumenten, hat eine
direkte Auswirkung auf den Handel und den Konsum. Ein Großteil der personalisier-
ten und damit der profitabelsten Form der Werbung findet sich heute im Internet.
Diese Werbung weckt im Online-Konsumenten ein - aufgrund seiner Internetaktivi-
täten - auf ihn zugeschnittenes Bedürfnis nach einem Konsumgut. Das Medium sorgt
zugleich für ein breites Spektrum an Möglichkeiten, welches das geweckte Bedürfnis
unmittelbar, etwa durch eine Reihe von Onlineshops, zu befriedigen versucht.
20
Die
steigende Bedeutung der Online-Produktsuche wird aus einem Bericht der ,,Studie
Social Commerce 2012"
21
deutlich. Demzufolge hat das Internet 2011 erstmalig die
Suche nach Weihnachtsgeschenken gegenüber konventionellen Handel dominiert.
Die Fähigkeit, Produkte nach gleichen Methoden online zu suchen und die Ergeb-
nisse zwischen zwei Shops zu vergleichen, führt zu einer Erhöhung der Transparenz
der Märkte im internationalen Warenaustausch.
Parallel dazu lässt sich jedoch auch ein entgegengesetzter Trend der Anbieter erken-
nen, bei dem die Produkte ganz bewusst - durch Vorenthalten prägnanter Informa-
19
Vgl. FOCUS Online - Mobile Shopping (2012)
20
Vgl. www.politikundunterricht.de (2010), S. 22 ff.
21
Vgl. Studie Social Commerce 2012 (2012), S. 5 ff.
11

tionen - anonymisiert werden. Dies macht den Vergleich von Waren im gewohnten
Stil nicht mehr möglich und basiert auf dem Wunsch der Anbieter, andere Faktoren
als Produktpreis und -eigenschaften zu entscheidenden Verkaufsargumenten hervor-
zuheben.
Die Online-Produktsuche bezieht sich demnach in erster Linie auf die Inhalte der
Onlineshops und der Vergleichsportale und nicht auf die Begriffs- bzw. Grafiksuche
(siehe auch Tabelle: ,,Top 10 - Produktsuchmaschinen - ohne Google-Shopping").
Aus Sicht des Shop- beziehungsweise des Vergleichsportalbetreibers eröffnet sich die
Möglichkeit, dem Konsumenten die Produktsuche zu vereinfachen und somit die
Kaufwahrscheinlichkeit zu erhöhen.
2.2.4
Grundidee der Optimierung
Eine Möglichkeit, die Produktsuche im WWW anhand eines Produktbildes zu er-
gänzen, bietet eine neuartige Suchfunktionalität mit großem praktischen Nutzungs-
potenzial. So können die Produkte nicht nur anhand von Stichwörtern, wie z.B.
Himmelbett, Holz, 200 x 160, Jugendstil gesucht, sondern durch ein Foto ergänzend
beschrieben werden.
Die Alternative zur konventionellen Suche bietet das Potenzial zur Verbesserung
der Suchergebnisse und Erhöhung der Markttransparenz. Des Weiteren könnte sie
in Verbindung mit mobilen Endgeräten eine ,,On Demand"-Echtzeitproduktsuche
ermöglichen (siehe Kapitel 5.2: ,,Richtungsweisende Entwicklungen").
Eine wesentliche, hierzu benötigte Eigenschaft, ist die Fähigkeit eines IT-Systems,
Ähnlichkeiten zwischen Produktfotos herstellen zu können. Dadurch besteht die
Möglichkeit diese bei der Online-Produktsuche zu berücksichtigen.
Die benötigten Eigenschaften entsprechen den Merkmalen eines Mustererkennungs-
systems auf der Basis künstlicher neuronaler Netze, die, durch Nachahmung der
Prozesse im menschlichen Gehirn, zur Erkennung und Zuordnung von verschiede-
nen grafischen Mustern fähig sind.
Nähere Erläuterungen zu einer Umsetzungskonzeption finden sich unter Kapitel 5:
,,Optimierung der Online-Produktsuche" wieder. Wie und woraus die neuronalen
Strukturen entstanden und wie sie aufgebaut sind, wird Kapitel 3: ,,Neuronale Net-
ze" aufzeigen.
12

3
Neuronale Netze
Der Aufbau eines KNN orientiert sich in vielen Wesensmerkmalen nahe am bio-
logischen Vorbild. Aus diesem Grund werden im Folgenden - unter Einhaltung der
Relevanz sowie Verhältnismäßigkeit der fachlichen Tiefe - erst biologische, dann tech-
nische Bestandteile der Neurone und ihrer neuronalen Verbindungen betrachtet.
Zunächst sollen jedoch die Unterschiede von der biologischen und technischen Da-
tenverarbeitung verdeutlicht werden. Die grundlegende unterschiedliche Architektur
der Systeme macht einen Vergleich schwierig. Während der Computer die Informa-
tionen Bit für Bit auf einer Festplatte in genau definierten Abständen nebeneinander
speichert, erfolgt der Speicherungsprozess im Gehirn an mehreren Orten gleichzei-
tig, je nach beigemessener Bedeutung jedoch zum Teil ungenau (Assoziativspeicher).
Ähnlich verhält es sich mit der Verarbeitung, bei welcher der Computer die Befehle
in einer fest definierten Abfolge linear ausführt, das Gehirn verarbeitet diese jedoch
hochgradig parallel mit gleichzeitiger Speicherung.
22
3.1
Biologische neuronale Netze
Ein neuronales Netz ist aus Neuronen, d.h. Nervenzellen aufgebaut. Der Zusam-
menschluss der Neurone erlaubt es Organismen über biochemische Signalübertra-
gung, -speicherung und -verarbeitung logische Operationen in einem Nervensystem
durchzuführen.
23
Diese biologischen Programme steuern die gesamte, heute bekann-
te, Fauna der Erde und somit auch den Menschen. Für jedes unbewusste Augen-
blinzeln bis hin zu der Formulierung der großen Frage nach dem Sein, sind die
spezialisierten, vernetzten Zellen in unserem Organismus verantwortlich. Für eine
angemessene Betrachtung der künstlichen neuronalen Netze ist ein grundsätzliches
Verständnis des biologischen Vorbildes erforderlich. Dafür werden in den folgenden
sechs Kapiteln die wesentlichsten Grundlagen zum Aufbau und zur Funktionsweise
von Neuronen und neuronalen Netzen vorgestellt.
22
Vgl. Ruelle, David (2010), S. 61 f.
23
Vgl. Buddecke, Eckhart (1994), S. 502
13

Details

Seiten
Erscheinungsform
Erstausgabe
Jahr
2012
ISBN (PDF)
9783863419509
ISBN (Paperback)
9783863414504
Dateigröße
1.5 MB
Sprache
Deutsch
Institution / Hochschule
FOM Hochschule für Oekonomie & Management gemeinnützige GmbH, Frankfurt früher Fachhochschule
Erscheinungsdatum
2015 (Februar)
Note
1,5
Schlagworte
Bionik Suchmaschine Google Project Glass Google Brille
Zurück

Titel: Buy what you see - everywhere: Welche Möglichkeiten bietet die grafische Mustererkennung zur Verbesserung der Online-Produktsuche?
book preview page numper 1
book preview page numper 2
book preview page numper 3
book preview page numper 4
book preview page numper 5
book preview page numper 6
book preview page numper 7
book preview page numper 8
book preview page numper 9
book preview page numper 10
book preview page numper 11
book preview page numper 12
book preview page numper 13
book preview page numper 14
book preview page numper 15
74 Seiten
Cookie-Einstellungen