atari-home.de - Foren

Allgemeines => Atari - Talk => Thema gestartet von: guest2451 am Sa 19.09.2009, 14:36:47

Titel: GeoCities Archiv
Beitrag von: guest2451 am Sa 19.09.2009, 14:36:47
http://us.geocities.com/retrogamer.geo/fsconsle.htm
http://www.geocities.com/s_h_3/
http://www.geocities.com/aliboom.geo/geobook.html
http://www.geocities.com/atari_mnx/helpdesk/music/music.htm
http://www.geocities.com/atari_mnx/helpdesk/scsi/scsi.htm
http://www.geocities.com/bpadinha/
http://www.geocities.com/clu-da-bard/spectrelist.html
http://www.geocities.com/doctor_clu/AUNT.html
http://www.geocities.com/doctor_clu/Artcase.html
http://www.geocities.com/doctor_clu/IMGJFeb06.pdf
http://www.geocities.com/icollect_2000/rarity.txt
http://www.geocities.com/~irata/1stword.html
http://www.geocities.com/~irata/16bit.html
http://www.geocities.com/~irata/1040stseries.html
http://www.geocities.com/~irata/2600specs.html
http://www.geocities.com/~irata/260st.html
http://www.geocities.com/~irata/32bit.html
http://www.geocities.com/~irata/8bit.html
http://www.geocities.com/~irata/atari.html
http://www.geocities.com/~irata/atari1450xld.html
http://www.geocities.com/~irata/atw800.html
http://www.geocities.com/~irata/background.html
http://www.geocities.com/~irata/bsfaq.txt
http://www.geocities.com/~irata/falconmicro.html
http://www.geocities.com/~irata/falcon040.html
http://www.geocities.com/~irata/jaguar.html
http://www.geocities.com/~irata/links.html
http://www.geocities.com/~irata/megasteseries.html
http://www.geocities.com/~irata/products.html
http://www.geocities.com/~irata/stacy.html
http://www.geocities.com/~irata/stbook.html
http://www.geocities.com/lady-aramis/Artcase.html
http://www.geocities.com/mnx_akai/pdf/mnx2010_akaisite_akai_atari.pdf
http://www.geocities.com/mnx_akai/pdf/mnx2010_akaisite_akai_total.pdf
http://www.geocities.com/museo8bits/atari_st.htm
http://www.geocities.com/siliconValley/vista/3015/32bit.html
http://www.geocities.com/siliconvalley/6880/hw-idescsi.html
http://www.geocities.com/SiliconValley/6880/nw-ethernet.html
http://www.geocities.com/siliconvalley/6880/nw-nullmodem.html
http://www.geocities.com/SiliconValley/6880/phsw.html
http://www.geocities.com/SiliconValley/6880/whatsup.html
http://www.geocities.com/SiliconValley/Lakes/6757/400.HTML
http://www.geocities.com/siliconvalley/lakes/6757/800.HTML
http://www.geocities.com/SiliconValley/Lakes/6757/ataricar.txt
http://www.geocities.com/siliconvalley/lakes/6757/fujicart.txt
http://www.geocities.com/siliconvalley/lakes/6757/MEGA.HTML
http://www.geocities.com/siliconvalley/peaks/6320/
http://www.geocities.com/siliconvalley/peaks/6320/ard/help/ahd01.htm
http://www.geocities.com/SiliconValley/Peaks/6320/ard/help/ahl01.htm
http://www.geocities.com/siliconvalley/peaks/6320/ard/links/links.htm
http://www.geocities.com/siliconvalley/peaks/6320/ard/links/quiklink.htm
http://www.geocities.com/siliconValley/vista/3015/falcon.html
http://www.geocities.com/soft154i/atari.htm
http://www.geocities.com/SoHo/1354/atari.htm
http://www.geocities.com/SoHo/6129/emuladores1.htm
http://www.geocities.com/TimesSquare/Lair/9260/sw.html
http://www.geocities.com/TimesSquare/Tower/7661/7800.htm
http://www.geocities.com/TimesSquare/Tower/7661/rarete.htm
http://www.geocities.com/timessquare/labyrinth/6694/carts.html
http://www.geocities.com/vegeta_wrath/dbzroms.html





Titel: Re: GeoCities Archiv
Beitrag von: Mathias am Sa 19.09.2009, 14:48:16
Ich habe nun einmal einen neuen Account angelegt.

Name: Archivar
Passwort: geocities

Nachdem wir noch keinen Parser gefunden haben, würde ich wirklich  gerne händisch beginnen. Oder hat irgendwer noch eine Idee wie wir  das von Maschinen übernehmen lassen könnten?

Ich dachte, der Einfachheit halber, die URLs die ihr findet, in die alphabetische Liste oben eintragen. Aber ganz so einfach ist die Sache dann auch nicht.

• Wenn wir eine tiefere URL finden, macht es eigentlich wenig Sinn die jeweils auch extra zu speichern (siehe Irrata). Aber wer garantiert, daß es von einer höheren einen Link gibt? Wie kann das ohne menschlicher Kontrolle - also alle URLs kontrollieren) organisiert werden?

• Wenn wir eine tiefere URL finden, haben wir keine elektronische Möglichkeit ab der Startseite zu sichern, oder fällt euch da etwas ein?

• Das System ist fehleranfällig, da wir dauernd gemeinsam eine einem Dokument arbeiten. Was haltet ihr davon, immer in einem lokalen Textdokument zu arbeiten, und dieses dann neu hochzuladen? Oder bekommen wir dann auch mit der ZEichenkodierung der unterschiedlichen Systeme Probleme?
Titel: Re: GeoCities Archiv
Beitrag von: Johannes am Sa 19.09.2009, 19:41:10
Hallo Mathias, hallo alle anderen Archivare ;)

OK, ich schreibe einen Parser für die Google Suchmaschine.

Wegen den Deeplinks:

1. Entweder wir vertrauen darauf, dass Google alle Einzelseiten erfasst hat (was ich glaube, denn wenn wir rekursiv alle Seiten speichern machen wir das höchstens so wie Google, wir folgen Links...). Dann können wir einfach die Einzelseiten erfassen.

2. Ich versuche in den Parser auch noch einen De-Duplizier-Mechanismus zu bauen. Das wird aber erstmal hinten angestellt.

Grüße
Johannes
Titel: Re: GeoCities Archiv
Beitrag von: afalc060 am Mo 02.07.2012, 16:19:42
vielleicht schon alt, aber ich hab es gerade erst gefunden..

Hier (http://archiveteam.org/index.php?title=Archives) gibt es ein 641GB Torrent mit Inhalten aus Geocities. Hat wer etwas Plattenplatz übrig  ;D
Titel: Re: GeoCities Archiv
Beitrag von: FrederickMeißner am Mo 02.07.2012, 17:23:59
gibt doch auch http://archive.org :)
Titel: Re: GeoCities Archiv
Beitrag von: afalc060 am Mo 02.07.2012, 18:27:13
wurden die alten sachen denn nun irgendwie gesichert? ausser durch wayback oder das Archiv?
Titel: Re: GeoCities Archiv
Beitrag von: FrederickMeißner am Mo 02.07.2012, 20:36:11
kp. ich kenn nur das http://archive.org/web/geocities.php
Titel: Re: GeoCities Archiv
Beitrag von: Gerry am Mo 09.07.2012, 16:32:55
Es gäbe da noch die Archive Geocities.ws (http://www.geocities.ws/search/local/) und ReoCities (http://www.reocities.com/neighborhoods/).
Titel: Re: GeoCities Archiv
Beitrag von: Johannes am Mo 09.07.2012, 21:21:11
Wir arbeiten im Moment im Büro daran, einen Volltextindex der Geocities Seiten zu erstellen. Damit wird es dann möglich sein, alle Geocities Seiten zu durchsuchen. Zurückgeliefert werden dann Treffer zu den Internetseiten, die wir dann zu Geocities.ws oder ReoCities oder Oocities verlinken werden (selbst hosten werden wir das nicht ;) ).

Dann können wir im Archiv auch nach Atari relevanten Dingen suchen...

vg
Johannes
Titel: Re: GeoCities Archiv
Beitrag von: MJaap am Di 10.07.2012, 02:26:58
Habe eben mal einen Test mit den sieben Geocties-Sites (wobei einige davon umgezogen sind) gemacht, auf die in der UTD verwiesen wird und da waren doch welche bei, die Archive.org nicht vollständig archiviert hatte....

http://www.geocities.com/ResearchTriangle/Lab/5621
www.geocities.com/SiliconValley/Bay/1209
www.geocities.com/tokilinetest/