Zu spät!

Die E-Mail Spammer sind aber spät dran… Heute kommen Mails mit dem Betreff „Vote for Mccane on our site“ und „Support Obama, buying from us“ bei mir an (ja, beide vom gleichen Versender).

Insgesamt kommt zur Zeit mal wieder ziemlich viel SPAM rein.

  • Potenzprobleme – ab heute nicht mehr
  • Potenzprobleme? Mit uns nicht mehr
  • Mann lebt nur einmal – probiers aus !
  • Ficken wie ein Weltmeister ?
  • 30 Minuten Sex – kein Problem
  • Blaue Pillchen – Endlich wieder Spass am Leben

Kann mal jemand dem Versender eine Briefbombe faxen?

Aaah, mein Desktop

Windows Dreamscene kann nicht ausgeführt werden, da der Desktop

Achso, na dann…

(Wenn man draufklickt, dann ist es etwas gesprächiger und sagt mir, dass es nicht geht, weil ich mehrere Grafikkarten im Rechner habe – wenn auch etwas kryptischer.)

Original Verpackung…

Wann versteht’s eigentlich der letzte: Wenn da steht „original Verpackung“, dann kauft man bei eBay die original Verpackung (auch bekannt als: einen leeren Karton)… Für (inzwischen) 126 Euro ein ziemlich teures Vergnügen.

10 Milliarden Fotos @ Facebook

Da bastelt man grad am großen Server-Umbau, und dann kommt da so eine Meldung von Facebook:

Here’s some other interesting recent stats on photos:

  • 2-3 Terabytes of photos are being uploaded to the site every day
  • We have just over one petabyte of photo storage
  • We serve over 15 billion photo images per day
  • Photo traffic now peaks at over 300,000 images served per second

Da fühlt man sich dann plötzlich wieder ganz klein…

Bot My Ass

Mein Gott, es ist voller Sterne… äääh… Bots… das Netz…

Über meinen Beitrag von vor drei Jahren kann man da eigentlich nur noch lachen… Acht Spider waren es damals in 20 Stunden…

Dieses mal sind es 36 Stunden – also fast doppelt so viel Zeit. Hier die Bots (die mir beim lesen der Log-Files aufgefallen sind):

  • BAGL/Nutch-0.9 (BaglBot; http://www.bagl.co.uk; MyEmail)
  • Baiduspider+(+http://www.baidu.com/search/spider_jp.html)
  • Baiduspider+(+http://www.baidu.com/search/spider.htm)
  • boitho.com-dc/0.86 ( http://www.boitho.com/dcbot.html )
  • CCBot/1.0 (+http://www.commoncrawl.org/bot.html)
  • curl/7.16.4 (i386-redhat-linux-gnu) libcurl/7.16.4 OpenSSL/0.9.8b zlib/1.2.3 libidn/0.6.8
  • Googlebot-Image/1.0
  • ia_archiver
  • ia_archiver-web.archive.org
  • ia_archiver (+http://www.alexa.com/site/help/webmasters; crawler@alexa.com)
  • Java/1.4.1_04
  • Java/1.6.0_03
  • Java/1.6.0_04
  • kalooga/KaloogaBot (Kalooga; http://www.kalooga.com/info.html?page=crawler; crawler@kalooga.com)
  • Microsoft URL Control – 6.00.8169
  • Mozilla/4.0 (compatible; NaverBot/1.0; http://help.naver.com/delete_main.asp)
  • Mozilla/5.0 (compatible; askpeter_jeanie_2009_bot/5.0; +http://www.askpeter.info)
  • Mozilla/5.0 (compatible; Ask Jeeves/Teoma; +http://about.ask.com/en/docs/about/webmasters.shtml)
  • Mozilla/5.0 (compatible; Charlotte/1.1; http://www.searchme.com/support/)
  • Mozilla/5.0 (compatible; DBLBot/1.0; +http://www.dontbuylists.com/)
  • Mozilla/5.0 (compatible; discobot/1.0; +http://discoveryengine.com/discobot.html)
  • Mozilla/5.0 (compatible; DotBot/1.1; http://www.dotnetdotcom.org/, crawler@dotnetdotcom.org)
  • Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
  • Mozilla/5.0 (compatible; MJ12bot/v1.2.3; http://www.majestic12.co.uk/bot.php?+)
  • Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)
  • Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)
  • Mozilla/5.0 (Twiceler-0.9 http://www.cuil.com/twiceler/robot.html)
  • Mozilla/5.0 (Windows; U; Windows NT 5.1; fr; rv:1.8.1) VoilaBot BETA 1.2 (support.voilabot@orange-ftgroup.com)
  • Mozilla/5.0 (Yahoo-MMCrawler/4.0; mailto:vertical-crawl-support@yahoo-inc.com)
  • MSMOBOT/1.1 (+http://search.msn.com/msnbot.htm)
  • msnbot/1.1 (+http://search.msn.com/msnbot.htm)
  • msnbot-media/1.0 (+http://search.msn.com/msnbot.htm)
  • Python-urllib/1.17
  • Snoopy v1.2
  • Sogou Pic Spider/3.0(+http://www.sogou.com/docs/help/webmasters.htm#07)
  • Sogou web spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)
  • sonarv2/1.16
  • SonyEricssonK800i/R1ED Browser/NetFront/3.3 Profile/MIDP-2.0 Configuration/CLDC-1.1 (Mediobot/1.0 +http://bot.medio.com)
  • Speedy Spider (http://www.entireweb.com/about/search_tech/speedy_spider/)
  • SurveyBot/2.3 (Whois Source)
  • Touche (+http://www.touche.com.ve)
  • Yandex/1.01.001 (compatible; Win16; I)
  • Yanga WorldSearch Bot v1.1/beta (http://www.yanga.co.uk/)
  • Yeti/1.0 (NHN Corp.; http://help.naver.com/robots/)
  • Yeti/1.0 (+http://help.naver.com/robots/)

Ausserdem kamen noch von folgenden IP-Adressen Zugriffe, die sich zwar als Browser ausgegeben haben, aber mit Sicherheit auch Bots sind:

  • 38.100.41.113 (IE7)
  • 38.105.83.12 (IE7)
  • 58.107.82.216 (kaputte Browser-Kennung)
  • 65.94.162.29 (IE6 – fragt robots.txt ab)
  • 65.94.7.199 (IE6 – fragt robots.txt ab)
  • 67.68.21.233 (IE6)
  • 69.58.178.26 – 41 (Firefox 1.0.7 – fragt robots.txt ab)
  • 70.99.174.23 (IE7)
  • 76.65.77.73 (IE6 – fragt robots.txt ab)
  • 84.166.237.84 (IE6 auf Win98 🙂 )
  • 89.149.241.118 (kaputte Browser-Kennung)
  • 92.75.218.76 (Firefox 3.0.3)

Eigentlich toll, dass es so viele Sicherheits-Kopien aller Webseiten gibt… 😉

Lustiges Server-Basteln

Wir sind ja (mal wieder) mitten im Umbauen unserer Server-Struktur. Dieses mal hoffentlich vorerst zum letzten mal – jedenfalls haben wir inzwischen alle Hardware, die wir gern von anfang an gehabt hätten.

Ab heute läuft mein Blog auf zwei getrennten Servern – einer, der die Webseite „ausführt“ (also der Webserver) und einem, der die Datenbank hält (also dem Datenbankserver). Mal sehen, ob das jetzt weitgehend funktioniert. Aber ich bin zuversichtlich 🙂

Ab mitte des Monats wollen wir dann unsere neuen Webserver in Betrieb nehmen, die sich die Last teilen – und noch wichtiger: Die gegenseitig einspringen, wenn einer der Server mal ausfallen sollte.

Und: Nein, das ist nicht primär für meinen Blog, sondern für unsere anderen Webseiten relevant. Der Blog ist da nur ein Nutznießer.

Lord Atombombsie

[16:18] <@BlaM> Ob wir uns drauf einigen können, dass wir alle Spielenamen auf deutsch überseten? 🙂

[16:20] <@BlaM> Wie soll man denn Stopwords (Worte ohne eigentlich Bedeutung) ausfiltern, wenn „Die“ in „Die by the Sword“ was anderes bedeutet als in „Die Schöne und das Biest“?

[16:21] <@shl> gute Frage

[16:21] <@shl> aber uebersetzen ist auch irgendwie doof

[16:22] <@BlaM> „Stirb von dem Schwert“ klingt doch toll 🙂

[16:22] <@shl> Schlingendorntal my ass!

[16:22] <@BlaM> Dogz -> Hundz?

[16:23] <@shl> 🙂

[16:23] <@BlaM> Duke Nukem -> Lord Atombombsie?

[16:23] <@shl> *G*

[16:23] <@shl> Monkey Island -> Affen Insel

[16:23] <@shl> neeeee!

Alte Computer-Hardware

Ich habe gerade drei alte Rechner ausgeschlachtet, da die morgen auf den Müll wandern. Ich wollte vorher aber noch mal in die Rechner reinschauen und alles, was vielleicht noch sinnvoll ist, aufheben.

Die Ausbeute:

  • ca. 30 Schrauben
  • 10 Slotbleche
  • 5 Frontblenden
  • Ein 3,5″ Diskettenlaufwerk
  • Eine Elsa PCI Grafikkarte
  • Anschlusskabel für Floppy (2x), IDE (2x) und SCSI (1x)

Irgendwie schon seltsam, dass das interessanteste an den PCs eigentlich die Schrauben waren – aber mal ehrlich: Was will ich mit einem SCSI Bandlaufwerk, für das ich heute sowieso keine Bänder mehr bekomme – und wenn doch, dann nur mit einer Größe von ein paar hundert Megabytes? Oder einem 12fach DVD-Laufwerk mit angegebenem Herstellungsdatum „Januar 1997“?