Allgemeines > Atari - Talk
ATARI Profibuch ST-STE-TT v2.0 per OCR als Word/PDF
guest3384:
Hallo zusammen,
anbei schon mal eine Leseprobe im DOCX-Format. Wer das mit seinen eigenen Hausmitteln (PC, etc.) nicht umformatieren kann, gibt mir bitte Bescheid, dann kann ich noch andere Formate einstellen.
Eine von mir durchgeführte erste Korrektur erfolgte bereits, es können aber durchaus noch Fehler enthalten sein. Die alte Rechtschreibung habe ich übrigens beibehalten, sonst wird es zu aufwändig.
Link zur Leseprobe: http://ul.to/lt7iaqvn
Gruß
Sascha
Burkhard Mankel:
# michschmi!
Auf meinem Notebook waren beim Kauf einige SetUps - ua. auch das Mikrosoft Office 2007 - gehabt. Die Programme waren auch schon vorinstalliert und ich habe das so belassen. Zur vollwertigen Nutzung von Office müßte ich mir aber kostenpflichtig einen Key beschaffen, was ich dank kostenlos erhältlichen Office-Versionen (eben das Open- bzw. Libre-Office) aber nicht zu tun gedenke. In einer abgespeckten Demo-Version kann ich aber auch das Mikrosoft Office starten. Ich habe es jetzt getestet und kann KEINE "*.ODT" Dateien laden. Entweder - was ich aber nicht glauben will - funktioniert diese Möglichkeit in der Demo-Nutzung nicht, oder - was ich ebenfalls nicht glauben kann - es gab mehrere Office 2007 Versionen! Da ich aber sowieso Libre und auch Open installiert habe und immer wieder aktualisiere, ist mir das auch im Weiteren egal!
Ich denke: "*.DOC" ist hier wohl die schlechteste Wahl. DOC wird auf dem Atari unter 1st Word+ und per PC unter Mikrosoft Office verwendet. versuche ich nun (zB. im Emulator) unter 1st Word eine PC-DOC-Datei zu öffnen, führt das genau so zu einer Fehlermeldung wie auch der Versuch, eine DOC-Datei aus einem Atari Programmordner über den PC-Desktop (es wird das bei mir installierte Office Textprogramm geladen) zu laden!
Zurück zum Profibuch:
Wie man den Links von mir oder Mathias entnehmen kann, liegt es im PDF Format im Netz bereit. Da man (ich) es sowieso nur benötige, wenn ich Hilfen für den Atari benötige, recht das doch (zumindest mir) vollständig, denn (abgesehen davon, daß ich bei der Notwendigkeit für Atari das Buch lesbar haben muß wenn ich am Atari bastel, kann ich es in diesem gar nicht laden) bei einer Anzeige von maximal 640 Pixel Bildbreite und 400 Bildhöhe dürfte es am Atari nicht sehr ansehnlich sein!
Johannes:
Irgendwie ist das symptomatisch für die ATARI-Szene: Es wird eine gute Initiative gestartet und man zerredet sich in der Diskussion über das beste Zielformat. Warum stellen wir nicht alle erdenklichen Formate zur Verfügung? Das sollte doch eigentlich nicht so viel Mehraufwand sein. Persönlich fänd ich ein durchsuchbares PDF ja am Besten, dann wird der Text (unsichtbar) über die Bilder gelegt und damit kann man WYSIWYG-mäßig selektieren und rauskopieren (und natürlich drin suchen). Aber eigentlich ist das Zielformat doch wurscht, Hauptsache man kann vernünftig drin suchen.
Um wieder back to topic zu kommen (da geb ich o2o recht ;) ) melde ich mich als Freiwilliger Korrekturleser für 50 Seiten.
Mal sehen, wie lang das dauert, danach evtl. mehr.
vg
Johannes
P.s.: Warum ist atariprofibuch.de eigentlich offline?
Mathias:
--- Zitat von: Johannes am Mi 13.03.2013, 09:30:20 ---Irgendwie ist das symptomatisch für die ATARI-Szene: Es wird eine gute Initiative gestartet und man zerredet sich in der Diskussion über das beste Zielformat. (…) Persönlich fänd ich ein durchsuchbares PDF ja am Besten
--- Ende Zitat ---
Jetzt wolltest Du aber nur beweisen, daß Du auch Teil der Atari-Szene bist, oder? ;D
--- Zitat von: Johannes am Mi 13.03.2013, 09:30:20 ---P.s.: Warum ist atariprofibuch.de eigentlich offline?
--- Ende Zitat ---
Vielleicht haben sichs ob der Debatte hier zuviele Menschen runtergeladen? ;D Hmm, gestern wars noch da, … kann wer den FM gesichertermaßen erreichen?
mfro:
--- Zitat von: Johannes am Mi 13.03.2013, 09:30:20 ---Persönlich fänd ich ein durchsuchbares PDF ja am Besten, dann wird der Text (unsichtbar) über die Bilder gelegt und damit kann man WYSIWYG-mäßig selektieren und rauskopieren (und natürlich drin suchen).
--- Ende Zitat ---
Da gebe ich Dir recht. Bloß: das wurde schon geleistet. Das PDF, das vorliegt, wurde offensichtlich schon beim Scannen durch OCR gejagt und ist durchsuchbar. Auch Markieren und Kopieren funktioniert.
Leider sind durch den OCR-Prozess (schlechte Scan-Qualität?) so viele Fehler drin, daß die Suche oft nicht das liefert, was man gerne fände, deshalb wäre meiner Ansicht nach eine Korrektur der OCR-Daten die erste Pflicht.
Ich weiß nicht, ob und wie das bei einem PDF geht, ohne den örtlichen Bezug zur gescannten Bitmap zu verlieren (gibt es einen PDF-Editor, der so was kann?).
Vielleicht bleibt am Schluß tatsächlich nur die Korrektur in einer Textverarbeitung und Neugenerierung des .pdf.
Navigation
[0] Themen-Index
[#] Nächste Seite
[*] Vorherige Sete
Zur normalen Ansicht wechseln