Textplagiate online finden mit PlagAware
Vor einigen Wochen habe ich begonnen den Dienst PlagAware zu nutzen um meine Webseite www.theofel.de gegen unautorisierte Nutzung meiner Texte zu schützen.
Dabei ist das natürlich kein Kopierschutz (wie sollte der auch funktionieren) sondern die Webanwendung sucht (potentielle) Textplagiate eurer Webseite. Diese können dann klassifiziert und verfolgt werden.
Die Abovarianten
Dabei habe ich mich von den verfügbaren Abomodellen bei PlagWare von FREE, LIGHT, STANDARD und PREMIUM für das kostenpflichtige Standard-Paket entschieden. Der Unterschied zwischen den Abos ist lediglich, wie viele Scancredits ihr bekommt und damit wie viele Seiten ihr monatlich scannen könnt. Beim FREE-Model, das kostenfrei ist, sind das 30 Seiten im Monat (also eine am Tag), bei LIGHT 180 pro Monat (für 2,99 Euro), bei STANDARD 530 pro Monat (für 7,49 Euro) und bei PREMIUM 1530 (für 14,99 Euro).
Da ich alleine etwas 5000 Blogposts online habe und nicht Jahre warten will, bis alles durch ist aber die Anzahl der zu bearbeitenden Treffer mir bei PREMIUM pro Tag zu hoch erschien, habe ich zum mittleren kostenpflichtigen Packet gegriffen.
Über Filter könnt ihr explizit nur bestimmte URLs eurer Seite prüfen lassen oder aber solche ausnehmen. So habe ich bei mir alle Blog-Archive ausgeschlossen, weil die ja ohnehin nur die gleichen Texte wie die Blogdetails enthalten können.
Wie funktioniert PlagAware für den Anwender?
In eurem Benutzerbereich erhaltet ihr eine Liste mit allen gefundenen potentiellen Textplagiaten. Dann geht es an das klassifizieren und erst mal um die Frage, ob es sich wirklich um ein Plagiat handelt. Dabei hilft sehr gut eine grafische Darstellung, die beide Texte miteinander vergleicht:
Ihr habt dann vier Möglichkeiten zu entscheiden:
1. Es handelt sich um ein Plagiat, dass verfolgt werden soll.
2. Es ist kein Plagiat und die URL soll von weiteren Prüfungen ausgeschlossen werden. (Beispielsweise bei Blogstöckchen, die anhand gleicher Fragen als potentielles Plagiat erkannt werden.)
3. Es ist kein Plagiat und die gesamte Domain soll von weiteren Prüfungen ausgeschlossen werden. (Beispielsweise für andere eigene Seiten, denen ihr vertraut.)
4. Es ist kein Plagiat und es soll kein Whitelisting vorgenommen werden.
Bei Seiten, die ihr verfolgen wollt, könnt ihr Notizen und Aufgaben anlegen. Damit könnt ihr die komplette Abwicklung der Fälle direkt in Plagware verwalten. Das sieht beispielhaft bei einem meiner abgeschlossenen Vorgänge so aus:
Wie funktioniert das Ganze?
Zur Erkennung von Plagiaten sucht die Software markante Textpassagen über Suchmaschinen. Sobald es Treffer gibt, kann der Text verglichen und als potentielles Plagiat vorgeschlagen werden. So können auch Texte als Plagiate erkannt werden, die nur teilweise übernommen, als Teil woanders übernommen oder umgeschrieben worden sind.
Dabei werden nur Texte verglichen - Bilder bleiben außen vor. Eine Erweiterung des Diensts auf Bilder ist nach meinen Informationen zur Zeit auch nicht geplant.
Ein praktischer Nebeneffekt soll auch nicht unerwähnt bleiben: PlagAware findet teilweise auch Zitate von eurer Seite, die ihr bislang noch nicht kanntet. So zitieren zahlreiche Buchshops meine Fazite aus Buchrezensionen...
Wozu das Ganze?
Ich habe bewusst entschieden, dass meine Blogtexte nicht unter CC stehen. Warum? Weil ich für meinen Content im Gegenzug Besucher haben möchte. Außerdem schwächen Textplagiate durch die Duplicate-Content-Problematik die eigene Webseite in Suchmaschinen.
Ein Beispiel: In einem großen Rezeptportal hat ein User eines meiner Rezepte samt Bild eingestellt. Diese wurde dort etwa 15.000 Mal abgerufen und hat dem Portal geschätzte 3000 Euro Werberlöse eingespielt. Davon habe ich "natürlich" keinen einzigen Cent gesehen, weil man sich dort darauf berufen kann, dass man für die Urheberrechtsverletzung nicht verantwortlich ist. Inzwischen ist das Rezept aber entfernt worden und die Besucher kommen wieder bei mir im Blog raus. Das bringt mir bei weitem nicht die gleichen Werbeeinnahmen (schön wär's), aber vielleicht ein paar Euro.
Wie verfolge ich Plagiate?
Ich versuche, die von Plagaware gefundenen Plagiate angemessen zu behandeln:
Bei Plattformen, die mit User-Generated-Content arbeiten, bleibt nicht viel mehr als diese zu informieren und eine Entfernung zu fordern - rechtlich ist da gar nichts anderes möglich.
Bei Medienprofis kenne ich (wie die umgekehrt ja meistens auch) kein Pardon. Die wissen genau, was sie machen. Neulich habe ich von Carsten Ulbricht einen Radiosender abmahnen lassen, die 11 Rezepttexte inklusive deren Bilder von mir ungefragt übernommen hatten.
Bei anderen schicke ich eine freundliche aber bestimmte E-Mail hin, dass zu unterlassen oder mich als Quelle anzugeben. Je nach Sachlage eventuell zusammen mit einer kleinen Entschädigung.
Selbst probieren?
Ich kann den Einsatz von PlagAware nur empfehlen! Ihr werdet überrascht sein, wer sich alles an euren Texten bedient hat...
Dank des FREE-Accounts bei PlagAware könnt ihr das Ganze erst mal unverbindlich und kostenlos testen. Dann hängt es von der Größe eurer Webseite ab, welches Abo sich für euch lohnt.
Geschrieben von Jan Theofel am 3.09.2010 um 0:56 Uhr (Permalink)
Abgelegt unter Internet
1 | benny | 7.09.2010 um 12:08