Jans Weblog

Persönliche Gedanken und Geschichten von Jan Theofel

« LED LENSER M7: Funktionen und einfache Bedienung im Video-Review | Main | Wie Skycheck/Port-47 Wikis zum Link-Spamming missbraucht »

Textplagiate online finden mit PlagAware

Plagiate dieser Website werden automatisiert erfasst und verfolgt.

Vor einigen Wochen habe ich begonnen den Dienst PlagAware zu nutzen um meine Webseite www.theofel.de gegen unautorisierte Nutzung meiner Texte zu schützen.

Dabei ist das natürlich kein Kopierschutz (wie sollte der auch funktionieren) sondern die Webanwendung sucht (potentielle) Textplagiate eurer Webseite. Diese können dann klassifiziert und verfolgt werden.

Die Abovarianten

Dabei habe ich mich von den verfügbaren Abomodellen bei PlagWare von FREE, LIGHT, STANDARD und PREMIUM für das kostenpflichtige Standard-Paket entschieden. Der Unterschied zwischen den Abos ist lediglich, wie viele Scancredits ihr bekommt und damit wie viele Seiten ihr monatlich scannen könnt. Beim FREE-Model, das kostenfrei ist, sind das 30 Seiten im Monat (also eine am Tag), bei LIGHT 180 pro Monat (für 2,99 Euro), bei STANDARD 530 pro Monat (für 7,49 Euro) und bei PREMIUM 1530 (für 14,99 Euro).

Da ich alleine etwas 5000 Blogposts online habe und nicht Jahre warten will, bis alles durch ist aber die Anzahl der zu bearbeitenden Treffer mir bei PREMIUM pro Tag zu hoch erschien, habe ich zum mittleren kostenpflichtigen Packet gegriffen.

Über Filter könnt ihr explizit nur bestimmte URLs eurer Seite prüfen lassen oder aber solche ausnehmen. So habe ich bei mir alle Blog-Archive ausgeschlossen, weil die ja ohnehin nur die gleichen Texte wie die Blogdetails enthalten können.

Wie funktioniert PlagAware für den Anwender?

In eurem Benutzerbereich erhaltet ihr eine Liste mit allen gefundenen potentiellen Textplagiaten. Dann geht es an das klassifizieren und erst mal um die Frage, ob es sich wirklich um ein Plagiat handelt. Dabei hilft sehr gut eine grafische Darstellung, die beide Texte miteinander vergleicht:

Textvergleich von PlagAware

Ihr habt dann vier Möglichkeiten zu entscheiden:
1. Es handelt sich um ein Plagiat, dass verfolgt werden soll.
2. Es ist kein Plagiat und die URL soll von weiteren Prüfungen ausgeschlossen werden. (Beispielsweise bei Blogstöckchen, die anhand gleicher Fragen als potentielles Plagiat erkannt werden.)
3. Es ist kein Plagiat und die gesamte Domain soll von weiteren Prüfungen ausgeschlossen werden. (Beispielsweise für andere eigene Seiten, denen ihr vertraut.)
4. Es ist kein Plagiat und es soll kein Whitelisting vorgenommen werden.

Bei Seiten, die ihr verfolgen wollt, könnt ihr Notizen und Aufgaben anlegen. Damit könnt ihr die komplette Abwicklung der Fälle direkt in Plagware verwalten. Das sieht beispielhaft bei einem meiner abgeschlossenen Vorgänge so aus:

PlagAware: Vorgangsliste

Wie funktioniert das Ganze?

Zur Erkennung von Plagiaten sucht die Software markante Textpassagen über Suchmaschinen. Sobald es Treffer gibt, kann der Text verglichen und als potentielles Plagiat vorgeschlagen werden. So können auch Texte als Plagiate erkannt werden, die nur teilweise übernommen, als Teil woanders übernommen oder umgeschrieben worden sind.

Dabei werden nur Texte verglichen - Bilder bleiben außen vor. Eine Erweiterung des Diensts auf Bilder ist nach meinen Informationen zur Zeit auch nicht geplant.

Ein praktischer Nebeneffekt soll auch nicht unerwähnt bleiben: PlagAware findet teilweise auch Zitate von eurer Seite, die ihr bislang noch nicht kanntet. So zitieren zahlreiche Buchshops meine Fazite aus Buchrezensionen...

Wozu das Ganze?

Ich habe bewusst entschieden, dass meine Blogtexte nicht unter CC stehen. Warum? Weil ich für meinen Content im Gegenzug Besucher haben möchte. Außerdem schwächen Textplagiate durch die Duplicate-Content-Problematik die eigene Webseite in Suchmaschinen.

Ein Beispiel: In einem großen Rezeptportal hat ein User eines meiner Rezepte samt Bild eingestellt. Diese wurde dort etwa 15.000 Mal abgerufen und hat dem Portal geschätzte 3000 Euro Werberlöse eingespielt. Davon habe ich "natürlich" keinen einzigen Cent gesehen, weil man sich dort darauf berufen kann, dass man für die Urheberrechtsverletzung nicht verantwortlich ist. Inzwischen ist das Rezept aber entfernt worden und die Besucher kommen wieder bei mir im Blog raus. Das bringt mir bei weitem nicht die gleichen Werbeeinnahmen (schön wär's), aber vielleicht ein paar Euro.

Wie verfolge ich Plagiate?

Ich versuche, die von Plagaware gefundenen Plagiate angemessen zu behandeln:

Bei Plattformen, die mit User-Generated-Content arbeiten, bleibt nicht viel mehr als diese zu informieren und eine Entfernung zu fordern - rechtlich ist da gar nichts anderes möglich.

Bei Medienprofis kenne ich (wie die umgekehrt ja meistens auch) kein Pardon. Die wissen genau, was sie machen. Neulich habe ich von Carsten Ulbricht einen Radiosender abmahnen lassen, die 11 Rezepttexte inklusive deren Bilder von mir ungefragt übernommen hatten.

Bei anderen schicke ich eine freundliche aber bestimmte E-Mail hin, dass zu unterlassen oder mich als Quelle anzugeben. Je nach Sachlage eventuell zusammen mit einer kleinen Entschädigung.

Selbst probieren?

Ich kann den Einsatz von PlagAware nur empfehlen! Ihr werdet überrascht sein, wer sich alles an euren Texten bedient hat...

Dank des FREE-Accounts bei PlagAware könnt ihr das Ganze erst mal unverbindlich und kostenlos testen. Dann hängt es von der Größe eurer Webseite ab, welches Abo sich für euch lohnt.

Tags: urheberrecht plagware plagiat

Geschrieben von Jan Theofel am 3.09.2010 um 0:56 Uhr (Permalink)
Abgelegt unter Internet

TrackBacks für »Textplagiate online finden mit PlagAware«

TrackBack URL: http://www.theofel.de/mt-cgi/mt-tb.cgi/6264

3 Kommentare zu »Textplagiate online finden mit PlagAware«

Ich muss doch trotzdem den Seitenbetreiber, der meinen Text gestohlen hat, anschreiben? Das Tool erleichtert doch nur das finden. Wie bekomme ich die Texte denn weg, wenn die Gegenseite auf meine Beschwerde gar nicht reagiert?

1 | benny | 7.09.2010 um 12:08

Das ist dir echt so viel wert? Wäre es mir glaube ich nicht...

2 | Ben | 15.09.2010 um 8:50

@benny: Korrekt, das Tool erleichtert nur das Auffinden der Plagiate. Wie du sie wegbekommst ist eine zweite Frage. Wenn eine freundliche E-Mail nicht weiterhilft, lass dich am besten rechtlich von einem Anwalt beraten. Der kann dir geeignete Schritte empfehlen.

@Ben: Wenn ich dadurch die Besucher nicht an andere Seiten verliere und so etwas mehr Werbeeinnahmen generieren kann rechnet es sich schon. Oder denke nur an eine einzige Nachlizenzsierung meiner Inhalte. Oder die Links die ich als "vergessene" Quellenangabe erhalten kann. All das ist es mir definitiv wert.

3 | Jan Theofel | 21.09.2010 um 23:31

Schreib bitte Deine Meinung:

Kommentare werden moderiert und erscheinen daher ggf. zeitverzögert. Bitte nur themenbezogene Kommentare abgeben die sich auf diesen Eintrag beziehen.

ACHTUNG: Es gilt meine Anti-SPAM-Policy! Werbende Kommentare und SEO-Linkspam werden nicht freigeschaltet. Statt dessen sende ich eine Beschwerde an den Profiteur der Werbung.
Bei persönlichen Meinungen bitte keine Links zu kommerziellen Projekten sonder zu eurer privaten Seite.

Jans Technik-Blog © 2004 - 2013 by Jan Theofel - Medien- und Werbedaten - Impressum - Datenschutz