Samstag, 6. Februar 2016

Unbezahlter Mitarbeiter bei Goolge werden

CAPTCHAs sind eine praktische Methode sicherzustellen, daß der Anwender ein Mensch ist und nicht irgendeine Software sich (automatisch) Zugang verschaffen will. Meistens handelt es sich dabei um irgendwelche sinnlosen Zeichen. Google dachte sich, daß man das Potential der zig-Tausend oder Millionen täglicher Abfragen auch sinnvoll nutzen kann. Ein Projekt von Google besteht darin, (alte) Bücher zu scannen und zu veröffentlichen. Damit die Texte durchsucht werden können, ist eine Schrifterkennung (OCR) notwendig. Diese scheitert sehr oft bei alten Vorlagen, weil die Schrifttypen sehr verschieden sind und die Vorlagen oft von schlechter Qualität oder verschmutzt sind. Menschen sind in der Lage, die Wörter trotzdem zu erkennen. In den Captchas wird deshalb ein unbekanntes Wort und ein bekanntest Wort angezeigt.

Der Benutzer gibt beide ein. Ist die Eingabe des bekannten Wortes korrekt, gilt der Benutzer über das Captcha als verifiziert und die Eingabe für das unbekannte Wort wird gespeichert. Das unbekannte Wort wird einer Vielzahl an Benutzern gezeigt. In der Datenbank entsteht so ein Sammlung von Eingaben. Das Wort, welches am häufigsten eingegeben wurde, dürfte mit relativ hoher Sicherheit das richtige sein. So können Tippfehler und andere Fehlerquellen minimiert werden. Durch die hohe Anzahl an Teilnehmern werden so relativ schnell viele Wörter erkannt und können voll automatisch in die Texterkennung übernommen werden.
Das ist eigentlich eine gute und sinnvolle Idee. Natürlich birgt die Nutzung von Google-Diensten wie immer die Gefahr, daß Google weitere Daten sammelt und Profile erstellt. Google kann jedes Captcha einer Anwendung zuordnen, da sich derjenige, der das Captcha anzeigen will, um den Nutzer zu überprüfen, für die Nutzung von reCaptcha bei Google eine Kennung besorgen muß.
Seit 2012 ging Google dazu über, auch gelegentlich Hausnummer anzuzeigen, die deren Streeview-Fahrzeuge aufgenommen haben. Das passierte aber nur gelegentlich und es war problemlos möglich, das jeweilige Captcha zu überspringen und wieder ein herkömmliches zu bekommen. Jetzt geht reCaptcha aber weiter und läßt massiv Straßenschilder bearbeiten. Es werden keine anderen Texte mehr präsentiert. Damit versucht Google seinen eigenen Streetview Dienst zu optimieren. Der Benutzer wird somit zum unbezahlten Mitarbeiter bei Google ohne daß die Allgemeinheit davon wirklich profitiert.