Hi all,
man kann sich fragen, ob man als Ersteller von Webseiten tatsächlich seine eigenen Mühen unentgeltlich in den Dienst von AI (KI) Produzenten - heute und in Zukunft - stellen will und stellen muss. Man sollte bedenken: das kann sich ja durchaus auf alles beziehen, was man so erzeugt - auf Texte oder Bilder oder Zeichnungen oder Software oder oder... Da bezüglich AI (KI) weltweit noch keine wirkliche Gesetzgebung existiert, werden in der Zwischenzeit die Copyright-Vermerke auf Websites oder Fotos wohl kaum etwas nützen !
Tatsächlich sperren deshalb heute schon viele Companies (NewYork Times, Reuters, CNN,...) diverse AI crawler explizit von ihren Websites aus:
Major websites are blocking AI crawlers from accessing their content
Auch gibt es natürlich juristische Verfahren von Copyright-Inhabern gegen diverse Netzfirmen (Google, OpenAI,...) , die Content so 'weiterverarbeiten'...
OpenAI hat im August ja tatsächlich schon angekündigt, einen GPTBot ins (heutige) Netz zuschicken, um die zukünftigen Sprachmodelle GPT-4/5 zu trainieren...
Wenn man das nicht so gut findet, was kann man als Privatmensch mit Website - als einfachste Massnahme/n - tun ? Scheint nicht komplett einfach zu sein...
robots.txt file anlegen:
User-agent: *
Disallow: /
Allerdings sagt Google dazu:
und
D.h. man muss mit
<meta name="robots" content="noindex">
in den Headern der Webseiten arbeiten.
Man kann aber auch *NUR* den im August 23 angekündigten ChatGPT-crawler aussperren (nach Angaben des Unternehmens) mit:
User-agent: GPTBot
Disallow: /
Heise sagt hierzu:
Diese (Minimal-) Massnahmen verlassen sich natürlich darauf, dass die Crawler diese Direktiven ernst nehmen und beachten. Ich gehe davon aus, dass OpenAI das (vorerst mal) tut. Ein gesetzlicher oder softwaretechnischer Zwang besteht aber nicht. Auch taugt diese Minimallösung nicht für wirkliche Security, da man sie einfachst umgehen kann wenn man will.
Wenn man harte Security will, muss man zwingend SSL/TLS verwenden, seine Site gegen freien Access sperren und User/Passwörter ausschliesslich an (nachweisliche) Menschen vergeben. Das ist jedoch zugegeben sehr unschön, und schränkt die freie Nutzung durch uns alle im Web sehr ein. Das wäre sehr schade und man will das eigentlich Nicht. ABER eine Entwicklung, die jedes Copyright negiert ist auch nicht gerade das wonach wir alle lechzen....
Gruss, Peter