Bad-Bot aus Deutschland: PixRay

Eigentlich wollte ich keinen eigenen Text schreiben sondern einen Kommentar auf den Post "Der RES ist ihnen egal" auf  barrierefreie-webloesungen.de verfassen, aber leider hat der Besitzer die Kommentarfunktion deaktiviert. Trotzdem ist der Text dort empfehlenswert, viele Ungereihmtheiten vom PixRay-Bot werden dort angesprochen. 

Kurz erklärt ist der Pixray-Bot ein Bot der das Web durchkämmt auf der Suche nach Urheberrechtsverstößen bei Bildern. Allerdings ist  das Ding ausnahmsweise mal ein deutsches Produkt. Bei mir ist der Bot über den User-Agent  "*pixray*" schön länger gesperrt. Eben war er nochmal getarnt da, aufgefallen ist er mir nur weil AWStats die IP zu "node-5-9-25-73.cluster.eu.webcrawler.pixray.com" aufgelöst hat. Laut den Logs kam der Aufruf wirklich von der IP 5.9.25.73, die aber nur 30 min später nur noch zu " static.5-9-25-73.clients.your-server.de" auflöst. Anscheinend möchte Pixray nicht erkannt werden. Der User-Agent (UA) war übrigens dieser halbe Roman: 

"Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; WOW64; Trident/4.0; BTRS124307; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; .NET CLR 3.5.21022; .NET CLR 3.5.30729; .NET CLR 3.0.30618; InfoPath.2; .NET4.0C; eMusic DLM/4; .NET CLR 1.1.4322; .NET4.0E;

Es sind verdammt viele .Net CLRs installiert.. auf einer Debian Kiste. Woher ich das weiss? Öh, ich muss dann mal weg. Wenn man Project Honeypot zu der IP befragt, dann kriegt man folgende User-Agents genannt: 

  • Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; WOW64; Trident/4.0; BTRS124307; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; .NET CLR 3.5.21022; .NET CLR 3.5.30729; .NET CLR 3.0.30618; InfoPath.2; .NET4.0C; eMusic DLM/4; .NET CLR 1.1.4322; .NET4.0E;
  • Pixray-Seeker/2.0 (Pixray-Seeker; http://www.pixray.com/pixraybot; crawler@pixray.com)

Da ist er wieder, der Pixray-Bot. Er tut also alles  um sich zu tarnen. Vielleicht hat er es bei mir mit den anderen UAs probiert, weil er bei mir als Pixray-Seeker schon gesperrt ist. So als verdeckter Ermittler, obwohl Pixray behauptet "Wir sind keine Schnüffler"

Gehostet werden die Pixray-Crawler übrigens u.a. bei Hetzner, meiner Meinung nach übrigens der größte Dreckschleuder-Hoster in Deutschland. Viele deutschsprachige Spammails kommen direkt von Hetzner-Kunden oder die beworbenen Webseiten sind bei Hetzner gehostet. Ich schicke die Mails brav an Spamcop, aber Spamcop schickt keine Meldungen an Hetzner. Meldung ist "reports disabled for abuse@hetzner" ohne Angabe weiterer Gründe. Ob Spamcop nicht mit Hetzner will oder Hetzner nicht mit Spamcop, das bleibt leider offen. 

Nachtrag 03.10.2012

in den letzten 14h war der Bot noch 67 mal da, von 15 weiteren IPs und mit diesem Tarn-UA von oben. Für diese IPs habe ich selbst frühere Einträge mit dem korrekten Pixray-UA. Alle Server sind wieder bei Hetzner gehostet:

  • 5.9.25.67
  • 5.9.25.68
  • 5.9.25.70
  • 5.9.25.71
  • 5.9.25.72
  • 5.9.25.73
  • 5.9.25.74
  • 5.9.25.75
  • 5.9.25.77
  • 5.9.25.79
  • 5.9.25.80
  • 5.9.25.81
  • 5.9.25.83
  • 5.9.25.84
  • 5.9.25.85

5.9.25.67 - 85 sind übrigens auch bei Project Honeypot als Pixray Seeker bekannt. Alle übrigens wieder ohne Reverse-DNS Namen. Wer will kann mit 5.9.25.64/27 die IPs 5.9.25.64-95 in einem Rutsch sperren. Wer denkt dass von Hetzner eh nur Schrott kommen kann der nimmt 5.9.0.0/16 und sperrt das Hetzner-AS AS24940 komplett.

Aber nein, Pixray schnüffelt nicht... 

Rubrik: 

Geld verdienen mit dem eigenen Blog

Das ist gar nicht mal so schwer, und man muss auch nicht seine Seite mit Werbung vollkleistern. Die VG Wort vergoldet deutsche Beiträge ab 1.800 Zeichen und einem jährlichen Mindestaufruf von 1.500 Besuchern und streng genommen müssen diese noch nichtmals im eigenen Blog stehen, sondern können überall stehen. Der Urheber des Textes muss diesen Text mit einem speziellen Zähler, ein unsichtbares Bild von der VG Wort, markieren. Am Ende des Jahres meldet man die Texte mit erreichten Mindestzugriff an die VG Wort. Den gleichen Text kann man jedes Jahr melden solange er aufgerufen wird. Die letzten Werte sind von 2010 und da ging's ab 15€ für das Minimum von 1.500 Zugriffen los.

Die "VG Wort" ist übrigens die Verwertungsgesellschaft Wort, die als Verwertungsgesellschaft nicht-erfassbare Vervielfältigungen von Texten mehr oder weniger vergüten soll. Sie verteilt dazu Abgaben auf Geräte (Drucker, Scanner, PCs, etc) und Leermedien (CD/DVD-Rohlinge, Kassetten, etc) nach einem eigenen Schlüssel an Autoren und Verlage.

Anmeldung bei der VG Wort

Zuerst sollte man sich bei der VG Wort anmelden aber braucht sich nur bei T.O.M (Texte Online Melden) anmelden, ein voller Wahrnehmungsvertrag ist nicht nötig. Nach dem Ausfüllen des Onlineformulars schickt man den generierten Antrag dann noch per Post ein. Irgendwann wird man dann freigeschaltet. Zählmarken kann man zwar auch ohne Anmeldung generieren, aber spätestens beim Jahreswechsel braucht man einen Account und man bekommt so automatisch eine Übersicht der Marken

Texte markieren

Zählmarken bekommt man bei TOM, also erstmal da anmelden. Am besten holt man sich direkt mal einen Schwung an Marken, bis zu 100 auf Einmal und 1000 im Jahr kann man bestellen. Aus technischer Sicht fast unbrauchbar aber am bequemsten ist der CSV-Download, den kann man mit Excel und Co öffnen und bearbeiten. So eine Zählmarke besteht aus einem vorgefertigten HTML <img> Tag, den man sofern HTML möglich ist, direkt verwenden kann. Ansonsten muss man sich die URL rausfriemeln und passend einbauen. Der Zählpixel ist unsichtbar, stört also auch nicht nicht im Design. Die "genauen" Regeln findet man hier, mehr gibt's leider nicht, technische Anleitungen findet man auf der TOM Seite oben links unter Hilfe. Diese sind für ähh technisch Unerfahrene geschrieben. Da ich jetzt erst meine Texte mit Zählmarken versehen habe, fehlt mir leider 3/4 dieses Jahres. 

Meldungen einreichen

Im nächsten Jahr, nachdem die VG Wort den jährlichen Mindestzugriff festgelegt hat, kann man die Texte, die diesen Mindestzugriff hatten, dann anmelden und noch ein paar Daten eingeben Auch wenn die VG Wort die Zugriffszahlen nicht anzeigt, so werden in der Counterliste standardmässig alle nicht-meldbaren Marken rausgefiltert. Nach der Anmeldung kommt dann irgendwann die Ausschüttung und irgendwann sollte es dann auch mal Geld gben. Soweit bin ich leider noch nicht. 

Blogs: Mehrere Texte auf einer Seite

Blogs haben üblicherweise eine chronologische Anzeige mehrerer Texte auf einer Seite und Anzeigen nach Kategorien oder Tags. Man hätte also auch mehrere Counter auf einer Seite und das evt. sogar unter mehreren Adressen (Seite X, Artikel mit Tag X Seite Z, etc). Könnte man als Betrug ansehen. Ist aber kein Problem. Ich habe nachgefragt und die Antwort war, dass das Okay geht, nur müssen die Texte vollständig angezeigt werden, also keine Anrisstexte oder so. Ob die Texte dann mehrfach gezählt werden oder irgendein Check die mehrfachen Aufrufe von der gleichen URL rausfiltert, keine Ahnung.

VG Wort und Impressum

Interessant ist auch die Überlegung ob evt. durch die Verwendung von VG Wort Zählpixeln eine Gewinnerzielungsabsicht vorliegt und man dadurch gewerblich handelt. Spätestens dann dürfte man impressumspflichtig sein, wobei ich die Juristen um die Feinheiten wann man ein gültiges Impressum haben muss und wie dieses aus zusehen hat, eh noch streiten und es vermutlich es auch immer werden, denn jede Unklarheit ist bares Geld für diese Branche. Who cares, lieber den üblichen Bullshit schreiben oder direkt im Ausland "anonym" hosten.

 

... Willkommen Drupal!

Ich hab mir jetzt Drupal installiert. Vielleicht ein bisschen Overkill um ein Blog zu betreiben, aber ich denke man kann die Installation noch für anderes gebrauchen, Drupal ist ja mandantenfähig, auch wenn ich noch nicht rausgefunden haben, wie gut die Trennung ist. Naja, ich werd's vielleicht rausfinden. Momentan ist hier noch gar nix fertig. Der alte Inhalt einschliesslich der Kommentare ist da.. irgendwie, die Formatierung ist flöten gegangen, ebenso die Bilder, vielleicht fix ich das mal.  Was fehlt momentan:

  • Design (schwarz & simpel)
  • Struktur (Blog und Spezielles)
  • Funktion (Feeds, Trackbacks, etc)
  • Einfache Inhaltserstellung (Markup, Filter, etc)

Also momentan ist hier Baustelle, WIP (Work in Progress), Coming Soon, etc ;)  Und warum geht die Seite jetzt schon online? Weil ich endlich mal wieder was schreiben wollte, mich mal so richtig auskotzen. Installiert ist es schon seit Mai, die alten Sachen sind schon umgezogen. Irgendwann muss es mal passieren. Stay tuned!

Tags: 

Tschüss Serendipity...

 

Ich hab mich nach langer Zeit doch mal dazu durchgerungen mich vom Blog-System Serendipity (S9y) zu trennen. Serendipity ist eigentlich ganz gut nur ist die PostgreSQL-Unterstützung zweitklassig. Der Hauptentwickler Garvin Hicking hat anscheinend nichtmals eine PostgreSQL-Installation zur Verfügung, so dass er nichtmal überprüfen kann ob seine Änderungen überhaupt drauf laufen. In letzter Zeit wurden in meinem Serverlog immer mehr fehlerhafte SQL-Abfragen geloggt die von Serendipity stammten. Garvin lässt sich zwar dabei helfen, aber ich hab echt keine Zeit (und Lust) mich damit zu befassen. Ich möchte in mein Blog nur meinen Text reinkloppen und gut ist. Von einer Initialinstallation mal abgesehen. Und so schwer ist es ja auch nicht sich noch PostgreSQL zu installieren. Und wenn's eine kleine virtuelle Machine mit VirtualBox, Linux, Apache, PHP, PostgreSQL und PHP ist. 

Und ich hab so ein bisschen das Gefühl dass S9y auf dem absteigenden Ast ist was den Fortschritt und Verfügbarkeit von Erweiterungen ist. Aber für ein reines Blog ist es echt super. 

Neues Blog

So, ich geh jetzt auch richtig unter die Blogger. Nicht mehr mit was selbstprogrammierten, sondern mit "Serendipity" einer Open-Source Blog-Software. War mir einfach viel zu viel Arbeit da jetzt selber was zu basteln, auch wenn´s Anpassen schon recht lange gedauert hat. So Sachen wie Ausnutzung der vollen Bildschirmbreite in allen Auflösungen und eine gescheite Druckausgabe sind mir halt wichtig, auch wenn ich mir nicht vorstellen kann, das sich irgendjemand den Mist hier ausdrucken möchte.

Tja und wofür ein Blog? Weniger um der Welt mitzuteilen wie ich mich fühle (hey, es heisst Stänkerblog, wie werd ich mich wohl fühlen) oder um der Welt mitzuteilen was mir alles dolles passiert, sondern eher um der Welt mitzuteilen, was mich ankotzt, sei es in der Cyberwelt oder draussen in der richtigen Welt. Und um gelegentlich mal einige Computer- und Programmiererkenntnisse zu verewigen, die auch anderen evt. weiterhelfen können. Mal schauen.

Ende der Durchsage