Autor Thema: GeoCities Archiv  (Gelesen 9198 mal)

0 Mitglieder und 1 Gast betrachten dieses Thema.

guest2451

  • Gast
GeoCities Archiv
« am: Sa 19.09.2009, 14:36:47 »
http://us.geocities.com/retrogamer.geo/fsconsle.htm
http://www.geocities.com/s_h_3/
http://www.geocities.com/aliboom.geo/geobook.html
http://www.geocities.com/atari_mnx/helpdesk/music/music.htm
http://www.geocities.com/atari_mnx/helpdesk/scsi/scsi.htm
http://www.geocities.com/bpadinha/
http://www.geocities.com/clu-da-bard/spectrelist.html
http://www.geocities.com/doctor_clu/AUNT.html
http://www.geocities.com/doctor_clu/Artcase.html
http://www.geocities.com/doctor_clu/IMGJFeb06.pdf
http://www.geocities.com/icollect_2000/rarity.txt
http://www.geocities.com/~irata/1stword.html
http://www.geocities.com/~irata/16bit.html
http://www.geocities.com/~irata/1040stseries.html
http://www.geocities.com/~irata/2600specs.html
http://www.geocities.com/~irata/260st.html
http://www.geocities.com/~irata/32bit.html
http://www.geocities.com/~irata/8bit.html
http://www.geocities.com/~irata/atari.html
http://www.geocities.com/~irata/atari1450xld.html
http://www.geocities.com/~irata/atw800.html
http://www.geocities.com/~irata/background.html
http://www.geocities.com/~irata/bsfaq.txt
http://www.geocities.com/~irata/falconmicro.html
http://www.geocities.com/~irata/falcon040.html
http://www.geocities.com/~irata/jaguar.html
http://www.geocities.com/~irata/links.html
http://www.geocities.com/~irata/megasteseries.html
http://www.geocities.com/~irata/products.html
http://www.geocities.com/~irata/stacy.html
http://www.geocities.com/~irata/stbook.html
http://www.geocities.com/lady-aramis/Artcase.html
http://www.geocities.com/mnx_akai/pdf/mnx2010_akaisite_akai_atari.pdf
http://www.geocities.com/mnx_akai/pdf/mnx2010_akaisite_akai_total.pdf
http://www.geocities.com/museo8bits/atari_st.htm
http://www.geocities.com/siliconValley/vista/3015/32bit.html
http://www.geocities.com/siliconvalley/6880/hw-idescsi.html
http://www.geocities.com/SiliconValley/6880/nw-ethernet.html
http://www.geocities.com/siliconvalley/6880/nw-nullmodem.html
http://www.geocities.com/SiliconValley/6880/phsw.html
http://www.geocities.com/SiliconValley/6880/whatsup.html
http://www.geocities.com/SiliconValley/Lakes/6757/400.HTML
http://www.geocities.com/siliconvalley/lakes/6757/800.HTML
http://www.geocities.com/SiliconValley/Lakes/6757/ataricar.txt
http://www.geocities.com/siliconvalley/lakes/6757/fujicart.txt
http://www.geocities.com/siliconvalley/lakes/6757/MEGA.HTML
http://www.geocities.com/siliconvalley/peaks/6320/
http://www.geocities.com/siliconvalley/peaks/6320/ard/help/ahd01.htm
http://www.geocities.com/SiliconValley/Peaks/6320/ard/help/ahl01.htm
http://www.geocities.com/siliconvalley/peaks/6320/ard/links/links.htm
http://www.geocities.com/siliconvalley/peaks/6320/ard/links/quiklink.htm
http://www.geocities.com/siliconValley/vista/3015/falcon.html
http://www.geocities.com/soft154i/atari.htm
http://www.geocities.com/SoHo/1354/atari.htm
http://www.geocities.com/SoHo/6129/emuladores1.htm
http://www.geocities.com/TimesSquare/Lair/9260/sw.html
http://www.geocities.com/TimesSquare/Tower/7661/7800.htm
http://www.geocities.com/TimesSquare/Tower/7661/rarete.htm
http://www.geocities.com/timessquare/labyrinth/6694/carts.html
http://www.geocities.com/vegeta_wrath/dbzroms.html






Offline Mathias

  • Benutzer
  • Beiträge: 1.577
Re: GeoCities Archiv
« Antwort #1 am: Sa 19.09.2009, 14:48:16 »
Ich habe nun einmal einen neuen Account angelegt.

Name: Archivar
Passwort: geocities

Nachdem wir noch keinen Parser gefunden haben, würde ich wirklich  gerne händisch beginnen. Oder hat irgendwer noch eine Idee wie wir  das von Maschinen übernehmen lassen könnten?

Ich dachte, der Einfachheit halber, die URLs die ihr findet, in die alphabetische Liste oben eintragen. Aber ganz so einfach ist die Sache dann auch nicht.

• Wenn wir eine tiefere URL finden, macht es eigentlich wenig Sinn die jeweils auch extra zu speichern (siehe Irrata). Aber wer garantiert, daß es von einer höheren einen Link gibt? Wie kann das ohne menschlicher Kontrolle - also alle URLs kontrollieren) organisiert werden?

• Wenn wir eine tiefere URL finden, haben wir keine elektronische Möglichkeit ab der Startseite zu sichern, oder fällt euch da etwas ein?

• Das System ist fehleranfällig, da wir dauernd gemeinsam eine einem Dokument arbeiten. Was haltet ihr davon, immer in einem lokalen Textdokument zu arbeiten, und dieses dann neu hochzuladen? Oder bekommen wir dann auch mit der ZEichenkodierung der unterschiedlichen Systeme Probleme?
« Letzte Änderung: Sa 19.09.2009, 14:50:58 von Mathias »
MegaST 4 mit Sounddesigner II MegaBus-Hardware und 56001, MegaSTE, Hades 040, MagiC Mac auf Mac OS 9 und eine FireBee.

Offline Johannes

  • Administrator
  • *****
  • Beiträge: 1.845
  • ATARI-HOME.DE - online for more than 20 years...
Re: GeoCities Archiv
« Antwort #2 am: Sa 19.09.2009, 19:41:10 »
Hallo Mathias, hallo alle anderen Archivare ;)

OK, ich schreibe einen Parser für die Google Suchmaschine.

Wegen den Deeplinks:

1. Entweder wir vertrauen darauf, dass Google alle Einzelseiten erfasst hat (was ich glaube, denn wenn wir rekursiv alle Seiten speichern machen wir das höchstens so wie Google, wir folgen Links...). Dann können wir einfach die Einzelseiten erfassen.

2. Ich versuche in den Parser auch noch einen De-Duplizier-Mechanismus zu bauen. Das wird aber erstmal hinten angestellt.

Grüße
Johannes
Falcon060 /w SV - TT030 - Mega STE4 - Mega ST4 - 1040 ST(F/M) - Lynx II - Portfolio
non-Atari: DEC Vaxstation 4000 VLC, SGI Fuel, SGI Octane, SGI Indigo 2 R10K, SGI Indy, Casio PB-1000

afalc060

  • Gast
Re: GeoCities Archiv
« Antwort #3 am: Mo 02.07.2012, 16:19:42 »
vielleicht schon alt, aber ich hab es gerade erst gefunden..

Hier gibt es ein 641GB Torrent mit Inhalten aus Geocities. Hat wer etwas Plattenplatz übrig  ;D

Offline FrederickMeißner

  • Atari Fanboy
  • Benutzer
  • Beiträge: 2.105
  • N/|\2d
Re: GeoCities Archiv
« Antwort #4 am: Mo 02.07.2012, 17:23:59 »
gibt doch auch http://archive.org :)

afalc060

  • Gast
Re: GeoCities Archiv
« Antwort #5 am: Mo 02.07.2012, 18:27:13 »
wurden die alten sachen denn nun irgendwie gesichert? ausser durch wayback oder das Archiv?

Offline FrederickMeißner

  • Atari Fanboy
  • Benutzer
  • Beiträge: 2.105
  • N/|\2d
Re: GeoCities Archiv
« Antwort #6 am: Mo 02.07.2012, 20:36:11 »

Offline Gerry

  • Benutzer
  • Beiträge: 297
  • Stay cool, stay Atari.
Re: GeoCities Archiv
« Antwort #7 am: Mo 09.07.2012, 16:32:55 »
Es gäbe da noch die Archive Geocities.ws und ReoCities.
Atari 520 ST(M) - 1 MB, Atari 1040 STE - 4 MB,  Atari Falcon 030 - 4 MB, Atari Falcon 030 4 MB ST-RAM + 8 MB Fast-RAM + FPU, 2 x Atari Lynx

Offline Johannes

  • Administrator
  • *****
  • Beiträge: 1.845
  • ATARI-HOME.DE - online for more than 20 years...
Re: GeoCities Archiv
« Antwort #8 am: Mo 09.07.2012, 21:21:11 »
Wir arbeiten im Moment im Büro daran, einen Volltextindex der Geocities Seiten zu erstellen. Damit wird es dann möglich sein, alle Geocities Seiten zu durchsuchen. Zurückgeliefert werden dann Treffer zu den Internetseiten, die wir dann zu Geocities.ws oder ReoCities oder Oocities verlinken werden (selbst hosten werden wir das nicht ;) ).

Dann können wir im Archiv auch nach Atari relevanten Dingen suchen...

vg
Johannes
Falcon060 /w SV - TT030 - Mega STE4 - Mega ST4 - 1040 ST(F/M) - Lynx II - Portfolio
non-Atari: DEC Vaxstation 4000 VLC, SGI Fuel, SGI Octane, SGI Indigo 2 R10K, SGI Indy, Casio PB-1000

Offline MJaap

  • Benutzer
  • Beiträge: 1.562
  • ST-Computer
Re: GeoCities Archiv
« Antwort #9 am: Di 10.07.2012, 02:26:58 »
Habe eben mal einen Test mit den sieben Geocties-Sites (wobei einige davon umgezogen sind) gemacht, auf die in der UTD verwiesen wird und da waren doch welche bei, die Archive.org nicht vollständig archiviert hatte....

http://www.geocities.com/ResearchTriangle/Lab/5621
www.geocities.com/SiliconValley/Bay/1209
www.geocities.com/tokilinetest/