Google macht KI-Richtlinie klarer und sorgt damit für Ärger

Google-Logo-Holz-Wand-re-publica-2023-Hero

Google hat seine Datenschutzbestimmungen übers letzte Wochenende aktualisiert und verdeutlicht, dass öffentlich zugängliche Informationen nicht davor sicher sind, ins Training seiner KI-Modelle einzufließen.

Unter anderem wurde der Begriff „Sprachmodelle“ durch „KI-Modelle“ ersetzt, außerdem will Google auf Basis dessen nicht nur Funktionen, sondern auch Produkte wie Bard und Cloud AI verbessern. Die Änderung betont, dass alles, was öffentlich online veröffentlicht wird, für das Training von Bard und anderen generativen KI-Produkten aus dem Hause Google verwendet werden kann.

Die Änderungen an Googles Datenschutzbestimmungen lassen sich hier an offizieller Stelle nachschlagen:

For example, we may collect information that’s publicly available online or from other public sources to help train Google’s languageAI models and build products and features like Google Translate, Bard, and Cloud AI capabilities. Or, if your business’s information appears on a website, we may index and display it on Google services.

Datenschutzerklärung von Google

Das Training von KI-Modellen ist aktuell ein heiß diskutiertes Thema. Besonders große Wellen schlug es im Bereich der Bildgenerierung, weil etwa für Midjourney, Stable Diffusion und DALL-E 2 ungefragt Tausende, vielleicht Millionen an urheberrechtlich geschützten Grafiken aus dem Internet gezogen wurden.

Ähnlich sieht es bei Textgeneratoren wie denen in ChatGPT aus, weswegen OpenAI kürzlich eine Sammelklage kassieren musste. Gleichzeitig ergreifen Contentplattform Maßnahmen, damit KI-Betreiber eben nicht mehr so einfach Inhalte abgreifen können, schauen wir uns beispielsweise den dramatischen Fall der Reddit-API an. Ähnliche Entwicklungen gibt es bei Twitter zu beobachten.

Obwohl alles, was öffentlich ins Internet gestellt wird, von jedermann eingesehen werden kann, ändert sich die Art und Weise, wie diese Informationen verwendet werden können. Das Hauptaugenmerk liegt nicht mehr darauf, wer auf die Daten zugreifen kann, sondern wie sie genutzt werden könnten.

Außerdem ist die Rechtmäßigkeit dieser Datenerhebungsmethode noch in der Schwebe.

Es ist damit zu rechnen, dass sich die Gerichte mit komplexen Fragen des Urheberrechts auseinandersetzen werden.

Matt G. Southern im Search Engine Journal

via

Mit * markierte Links sind provisionierte Affiliate-Links.

Kommentar verfassen

Bleibt bitte nett zueinander!