Autor Thema: Geocities; was tun?! – aber schnell!  (Gelesen 14979 mal)

0 Mitglieder und 1 Gast betrachten dieses Thema.

Offline Johannes

  • Administrator
  • *****
  • Beiträge: 1.844
  • ATARI-HOME.DE - online for more than 20 years...
Re: Geocities; was tun?! – aber schnell!
« Antwort #40 am: Mo 21.09.2009, 18:54:27 »
Hallo zusammen,

bevor ihr euch alle händisch ans Werk macht, gebt mir ein bisschen Zeit, ich möchte einen Parser für Google schreiben...

Je nachdem wieviel Zeit ich investieren kann, sollte der bald so weit sein.

Johannes

Hallo Johannes, wie hast Du jetzt diese Liste erstellt und unter welchem OS?

Gruß Arthur

Ich habe ein kleines Konsolenprogramm (.NET 3.5 in C#, unsere "Haussprache") geschrieben. Das läuft unter Windows, baut eine HTTP-Verbindung auf, Fragt Google, holt sich die Ergebnisseite, säubert den HTML-Code, wandelt diesen in XML um und dann hole ich per XPath suchausdrücken die Links aus dem Dokument. Dann schaue ich noch mit Hilfe einer Liste, ob die Links schonmal gefunden wurden und speichere das ganze ab. Zwischendurch macht das Programm noch zufällige Pausen und verändert den HTTP-Header, damit Google mir nicht auf die Schliche kommt.

Falcon060 /w SV - TT030 - Mega STE4 - Mega ST4 - 1040 ST(F/M) - Lynx II - Portfolio
non-Atari: DEC Vaxstation 4000 VLC, SGI Fuel, SGI Octane, SGI Indigo 2 R10K, SGI Indy, Casio PB-1000

Offline tuxie

  • Benutzer
  • Beiträge: 6.830
  • Falcon! Milan! Schuetzt die Raubvoegel!
Re: Geocities; was tun?! – aber schnell!
« Antwort #41 am: Mo 21.09.2009, 18:56:10 »
Ich dachte mehr das auch noch jemand leechen möchte, deswegen habe ich die wget syntax hier gepostet! Weil reicht ja wenn sich einer die manpages durchforstet.
Tschau Ingo

Offline Johannes

  • Administrator
  • *****
  • Beiträge: 1.844
  • ATARI-HOME.DE - online for more than 20 years...
Re: Geocities; was tun?! – aber schnell!
« Antwort #42 am: Mo 21.09.2009, 18:57:23 »
Also, ich glaube das echt eine Arbeit ist die nicht wirklich viel bringt! Das was er bis jetzt runder geladen hat ist nicht wirklich brauchbar!!

Sehrrrrrrrr viele Links tot!!

und es ist sehr viel bei, was mit Atari Garnix zu tun hat.

Ähm, das macht er momentan nicht, naja läuft jetzt schon einige Zeit und es ist noch kein Gigabyte zusammen gekommen. Aber sicher schon an die 1000 seiten durch!

Wenn du die toten Links ausgeben lassen könntest, könnte man WGET dann nochmal über den Google-Cache laufen lassen...
Falcon060 /w SV - TT030 - Mega STE4 - Mega ST4 - 1040 ST(F/M) - Lynx II - Portfolio
non-Atari: DEC Vaxstation 4000 VLC, SGI Fuel, SGI Octane, SGI Indigo 2 R10K, SGI Indy, Casio PB-1000

Offline tuxie

  • Benutzer
  • Beiträge: 6.830
  • Falcon! Milan! Schuetzt die Raubvoegel!
Re: Geocities; was tun?! – aber schnell!
« Antwort #43 am: Mo 21.09.2009, 18:59:04 »
Ich schau was ich machen kann! Denke werde da doch ein shellscript bauen müssen.

Wer möchte bekommt von mir die FTP zugangsdaten und kann mal rein sehen!!

Tschau Ingo

Offline Arthur

  • Benutzer
  • Beiträge: 10.302
  • Mein Atari erinnert mich an die gute alte Zeit..
Re: Geocities; was tun?! – aber schnell!
« Antwort #44 am: Mi 23.09.2009, 00:13:24 »
Irgendwie sind die Links nicht das was ich erwartet habe. Die Idee war nicht schlecht. Ich kann mit dem Zeug nichts anfangen. Zuviel das nichts mit Atari was zu tun hat. Allein das Durchforsten kann Wochen dauern und mit 8Bit kann ich mich nicht so recht anfreunden. Wär besser wenn spezifiziertere Suchbegriffe benutzt würden und mit mehreren Listen (Atari ST, STe, TT, Falcon, Jaguar u.s.w.) gearbeitet würde.

Gruß Arthur

afalc060

  • Gast
Re: Geocities; was tun?! – aber schnell!
« Antwort #45 am: Mi 23.09.2009, 01:27:47 »
Ich habe nun nicht auf die Liste Zugriff, aber:
Es geht um Atari allgemein und nicht nur um spezielle interessengebiete von speziellen Personen. Herzlichen Dank für die Beachtung!

Offline Arthur

  • Benutzer
  • Beiträge: 10.302
  • Mein Atari erinnert mich an die gute alte Zeit..
Re: Geocities; was tun?! – aber schnell!
« Antwort #46 am: Mi 23.09.2009, 02:17:37 »
Hier ist die Liste.

Für Wenigleser: Die Datei ist keine PDF-Datei sondern eine gezippte Textdatei. Also voher bitte umbenennen und dann entzippen.


Offline Mathias

  • Benutzer
  • Beiträge: 1.577
Re: Geocities; was tun?! – aber schnell!
« Antwort #47 am: Mo 26.10.2009, 16:29:13 »
Wollte nur mal´ nachfragen, da wir ja nurmehr wenige Stunden Zeit haben, wie´s aussieht?

MegaST 4 mit Sounddesigner II MegaBus-Hardware und 56001, MegaSTE, Hades 040, MagiC Mac auf Mac OS 9 und eine FireBee.

Offline Mathias

  • Benutzer
  • Beiträge: 1.577
Re: Geocities; was tun?! – aber schnell!
« Antwort #48 am: Fr 13.11.2009, 07:57:42 »
Ganz plump gefragt, weil ich seit 26.10. keine Antwort bekommen hab´:

Haben wir´s verpfuscht?
MegaST 4 mit Sounddesigner II MegaBus-Hardware und 56001, MegaSTE, Hades 040, MagiC Mac auf Mac OS 9 und eine FireBee.