Autor Thema: Signum!2 Datei-Konverter  (Gelesen 2961 mal)

0 Mitglieder und 1 Gast betrachten dieses Thema.

Offline Xiphoseer

  • Benutzer
  • Beiträge: 9
Signum!2 Datei-Konverter
« am: So 28.02.2021, 09:59:34 »
Guten Morgen!

ich schraube seit etwa einem halben Jahr an einem Konverter für SIgnum!2 SDO-Dateien. Urspünglich war das Ziel "nur" einen ASCII Export zu bauen, aber wegen mancher Eigenarten von Signum (bspw. Leerzeichen sind keine Buchstaben; tiefgestellter Text ist an der gleichen Stelle in einer neuen Zeile) funktioniert PDF deutlich besser.

Mittlerweile funktioniert es ziemlich gut, und es reicht für die meisten Dokumente ein sdo-tool --format pdf TEXT.SDO, um eine konvertierte Datei zu bekommen. Die Ergebnis-PDFs sind durchsuchbar; wenn Mapping-Dateien verwendet werden sogar auch bei neu-belegten Zeichensätzen (Griechisch, Hebräisch, …). Bilder funktionieren seit dieser Woche auch. Ich habe mal zwei Beispieldateien angehängt.

Braucht jemand von euch so ein Tool? Habt ihr vielleicht alte Signum-Dokumente als ASCII exportiert, aber fändet ein komplettes PDF noch besser? Hat jemand noch kaputte oder besonders ungewöhnliche Signum Dokumente? Sonstige Anregungen?

Das Tool selbst findet sich unter https://xiphoseer.github.io/sdo-tool

Offline Thorsten Otto

  • Benutzer
  • Beiträge: 1.248
Re: Signum!2 Datei-Konverter
« Antwort #1 am: So 28.02.2021, 10:44:51 »
Ich selber habe keine SDO Dokumente, aber ich bin mir ziemlich sicher daß es für sowas dankbare Anwender gibt ;) Schonmal im englischen forum gefragt?

Offline Xiphoseer

  • Benutzer
  • Beiträge: 9
Re: Signum!2 Datei-Konverter
« Antwort #2 am: So 28.02.2021, 11:26:41 »
Schonmal im englischen forum gefragt?
Bisher noch nicht, werde ich aber vermutlich noch machen.

Offline gh-baden

  • Benutzer
  • Beiträge: 1.967
Re: Signum!2 Datei-Konverter
« Antwort #3 am: So 28.02.2021, 13:22:10 »
Mittlerweile funktioniert es ziemlich gut, und es reicht für die meisten Dokumente ein sdo-tool --format pdf TEXT.SDO, um eine konvertierte Datei zu bekommen. Die Ergebnis-PDFs sind durchsuchbar;

Tolle Sache! Da wird es sicher dankbare Abnehmer:innen für geben. Ich wurde immer mal wieder nach Lösungen gefragt über die Jahre hinweg (auch hier) und mein bester Tipp bisher war: in eine PCL-Datei drucken, die auf einen Mac hieven und mit PCL2PDF wandeln. Sieht zwar gut aus, aber ist natürlich nur ein Bild in einem PDF, nicht durchsuchbar, nichts kopierbar.

Wirst du dein Projekt veröffentlichen, und auch den Source dazu? Ich blind …
« Letzte Änderung: So 28.02.2021, 20:09:22 von gh-baden »
Wider dem Signaturspam!

Offline Arthur

  • Benutzer
  • Beiträge: 10.302
  • Mein Atari erinnert mich an die gute alte Zeit..
Re: Signum!2 Datei-Konverter
« Antwort #4 am: So 28.02.2021, 15:50:07 »
Wenn man die Hilfe von sdo-tool.exe aufruft wird noch nicht für den Parameter -F pdf aufgelistet sondern nur:

 -F, --format <format>
            Format of the output. Valid choices are:

            "txt", "html", "ps", "png", and "pdraw" [default: txt]
        --meta <meta>
            Meta parameter as a file


Bei der Ausgabe der Gemini Anleitung als PDF beschwert er sich:

C:\Users\Admins\Desktop\Sig-Tool>sdo-tool.exe -F ps -C ./CHSETS GEMNI01.SDO
 INFO  sdo_tool::cli::sdoc > Loading '0001' chunk
 INFO  sdo_tool::cli::sdoc > File created: 07.05.1991 10:22:00
 INFO  sdo_tool::cli::sdoc > File modified: 13.08.1991 07:40:52
 INFO  sdo_tool::cli::sdoc > Loading 'cset' chunk
 INFO  sdo_tool::cli::sdoc > CHSETS: ["GROTLT", "ROKWEL15", "", "", "", "", "", ""]
 WARN  signum::chsets::cache > Editor font for `GROTLT` not found!
 WARN  signum::chsets::cache > Editor font for `ROKWEL15` not found!
 INFO  sdo_tool::cli::sdoc   > Editor fonts available for all character sets
 INFO  sdo_tool::cli::sdoc   > Printer fonts (24-needle) available for all character sets
 INFO  sdo_tool::cli::sdoc   > Printer fonts (laser/30) available for all character sets
 INFO  sdo_tool::cli::sdoc   > Printer fonts (9-needle) available for all character sets
 INFO  sdo_tool::cli::sdoc   > Loading 'sysp' chunk
 INFO  sdo_tool::cli::sdoc   > Loading 'pbuf' chunk
 INFO  sdo_tool::cli::sdoc   > Loaded page table with 90 entries
 INFO  sdo_tool::cli::sdoc   > Loading 'tebu' chunk
 INFO  sdo_tool::cli::sdoc   > Loaded text for 90 page(s)!
 INFO  sdo_tool::cli::sdoc   > Loading 'hcim' chunk
 INFO  sdo_tool::cli::sdoc   > Found 23 image(s)
'pl01': 0
'syp2': 64
Writing `GEMNI01.ps` ... Done!



Bei der Ausgabe als png enthält dies nur die Bilder der Rest der Seiten ist ohne Text.... was mache ich falsch? Bei der Ausgabe als ps und dem Versuch die Datei mit GIMP zu öffnen hängt sich das ps Programm von GIMP auf.

Aber das Tool so wie es die Parameter entgegen nimmt und die Optionen die geboten werden ist wirklich sinnvoll und hilfreich wenn ich es mal schaffen würde.

Ein klasse Tool das immer noch seine Liebhaber finden wird... wenn nicht mehr so viele wie es 1995 gewesen wären.  ;)

Offline Xiphoseer

  • Benutzer
  • Beiträge: 9
Re: Signum!2 Datei-Konverter
« Antwort #5 am: So 28.02.2021, 17:05:36 »
Wirst du dein Projekt veröffentlichen, und auch den Source dazu?

Die Source ist öffentlich einsehbar auf https://github.com/xiphoseer/sdo-tool. Dort liegen auch entsprechene Release-Binaries für Mac, Linux und Windows. Die einzelnen Komponenten wie den SDO-Parser veröffentliche ich nach und nach unter MPL-2.0, das Tool als ganzes kann privat gerne genutzt werden, soll aber erstmal nicht einfach durch Dritte weiterverteilt werden.

Wenn man die Hilfe von sdo-tool.exe aufruft wird noch nicht für den Parameter -F pdf aufgelistet sondern nur:

 -F, --format <format>
            Format of the output. Valid choices are:

            "txt", "html", "ps", "png", and "pdraw" [default: txt]
        --meta <meta>
            Meta parameter as a file


Danke, sollte in der nächsten Version gefixt sein.

Bei der Ausgabe der Gemini Anleitung als PDF beschwert er sich:

C:\Users\Admins\Desktop\Sig-Tool>sdo-tool.exe -F ps -C ./CHSETS GEMNI01.SDO
 INFO  sdo_tool::cli::sdoc > Loading '0001' chunk
 INFO  sdo_tool::cli::sdoc > File created: 07.05.1991 10:22:00
 INFO  sdo_tool::cli::sdoc > File modified: 13.08.1991 07:40:52
 INFO  sdo_tool::cli::sdoc > Loading 'cset' chunk
 INFO  sdo_tool::cli::sdoc > CHSETS: ["GROTLT", "ROKWEL15", "", "", "", "", "", ""]
 WARN  signum::chsets::cache > Editor font for `GROTLT` not found!
 WARN  signum::chsets::cache > Editor font for `ROKWEL15` not found!
 INFO  sdo_tool::cli::sdoc   > Editor fonts available for all character sets
 INFO  sdo_tool::cli::sdoc   > Printer fonts (24-needle) available for all character sets
 INFO  sdo_tool::cli::sdoc   > Printer fonts (laser/30) available for all character sets
 INFO  sdo_tool::cli::sdoc   > Printer fonts (9-needle) available for all character sets
 INFO  sdo_tool::cli::sdoc   > Loading 'sysp' chunk
 INFO  sdo_tool::cli::sdoc   > Loading 'pbuf' chunk
 INFO  sdo_tool::cli::sdoc   > Loaded page table with 90 entries
 INFO  sdo_tool::cli::sdoc   > Loading 'tebu' chunk
 INFO  sdo_tool::cli::sdoc   > Loaded text for 90 page(s)!
 INFO  sdo_tool::cli::sdoc   > Loading 'hcim' chunk
 INFO  sdo_tool::cli::sdoc   > Found 23 image(s)
'pl01': 0
'syp2': 64
Writing `GEMNI01.ps` ... Done!


Bei der Ausgabe als png enthält dies nur die Bilder der Rest der Seiten ist ohne Text.... was mache ich falsch? Bei der Ausgabe als ps und dem Versuch die Datei mit GIMP zu öffnen hängt sich das ps Programm von GIMP auf.

Hmm, zunächst einmal ist der Unterordner "CHSETS" im selben Ordner wie die SDO-Datei die Standardeinstellung, das Argument kann man also weglassen. Die Warnungen sagen, dass die Dateien "GROTLT.E24" und "ROKWEL15.E24" nirgendwo in dem Ordner gefunden wurden. Dadurch bricht die Font-Logik direkt ab und der Cache ist leer, daher die nächsten vier Zeilen und das leere Dokument.

Dadurch wird die Definition der Font im PS Dokument gar nicht erst geschrieben (Warnung habe ich gerade eingebaut) und das Resultat ist ungültig. Ich hab Kopien von beiden Editor- und Printerfonts, gibt es das Dokument irgendwo zum herunterladen? Jetzt wo Bilder implementiert sind, kann der PDF Export auch mehr als der PS Export.

Aber das Tool so wie es die Parameter entgegen nimmt und die Optionen die geboten werden ist wirklich sinnvoll und hilfreich wenn ich es mal schaffen würde.

Ein klasse Tool das immer noch seine Liebhaber finden wird... wenn nicht mehr so viele wie es 1995 gewesen wären.  ;)

:D

Offline Arthur

  • Benutzer
  • Beiträge: 10.302
  • Mein Atari erinnert mich an die gute alte Zeit..
Re: Signum!2 Datei-Konverter
« Antwort #6 am: So 28.02.2021, 18:19:00 »
@Xiphoseer, hast eine PM.

Offline gh-baden

  • Benutzer
  • Beiträge: 1.967
Re: Signum!2 Datei-Konverter
« Antwort #7 am: So 28.02.2021, 20:17:59 »
Mittlerweile funktioniert es ziemlich gut, und es reicht für die meisten Dokumente ein sdo-tool --format pdf TEXT.SDO, um eine konvertierte Datei zu bekommen. […] Sonstige Anregungen?

Etwas Kritik am Aufrufformat – ohne Switch-Parameter aufgerufen, hängt’s an der Input-Datei, was passiert: Konsolenausgabe oder Formatwandlung in eine andere Datei („to convert an IMC image file to a PNG file“). Wenn man aber SDO formatwandeln will, dann braucht es eine Switch-Parameter-Angabe. Das ist inkonsistent. Warum nicht "--format png" auch für IMC nehmen?
Wider dem Signaturspam!

Offline Xiphoseer

  • Benutzer
  • Beiträge: 9
Re: Signum!2 Datei-Konverter
« Antwort #8 am: So 28.02.2021, 23:18:35 »
Etwas Kritik am Aufrufformat – ohne Switch-Parameter aufgerufen, hängt’s an der Input-Datei, was passiert: Konsolenausgabe oder Formatwandlung in eine andere Datei („to convert an IMC image file to a PNG file“). Wenn man aber SDO formatwandeln will, dann braucht es eine Switch-Parameter-Angabe. Das ist inkonsistent. Warum nicht "--format png" auch für IMC nehmen?
Ja, guter Punkt. Bisher ist nur PNG implementiert, daher "funktioniert" --format png jetzt schon, der Format-Parameter wird schlicht ignoriert. Die Bilder sind aber auch zu groß um sie in der Konsole auszugeben. Was wäre denn eine hilfreiche Konsolenausgabe?

Andererseits würde ich gerne die Menge an Kram reduzieren die bei sdo-tool <DATEI> ausgegeben wird, sollte da ggf. für jede Sorte Datei ein Export stattfinden?

Offline Arthur

  • Benutzer
  • Beiträge: 10.302
  • Mein Atari erinnert mich an die gute alte Zeit..
Re: Signum!2 Datei-Konverter
« Antwort #9 am: Mo 01.03.2021, 00:17:15 »
Textausgabe in Datei funktioniert nicht... mein System ist übrigens W10

Hier als Beispiel:

sdo-tool.exe -F txt GEMNI01.SDO -- Gemini.txt

Gibt alles in einem Rutsch auf dem Bildschirm aus...

Also Rückgabewerte von sdo-tool plus alle 90 Seiten als txt aber teils mit Parametern wie <b></b> für bold etc. also kein reiner Text. Eine Gemini.txt-Datei wird auch nicht erzeugt. "Ein umleiten der Bildschirmausgabe in eine Datei ist bestimmt möglich aber wohl nicht im Sinne des Erfinders und dann müßte man alles störende von Hand raus löschen"

Positives anderes Beispiel:

sdo-tool.exe -F html GEMNI01.SDO -- Gemini.html

Ergibt eine wirklich sehr schöne HTML-Datei die sehr gut im Browser lesbar ist.

« Letzte Änderung: Mo 01.03.2021, 00:20:57 von Arthur »

Offline Xiphoseer

  • Benutzer
  • Beiträge: 9
Re: Signum!2 Datei-Konverter
« Antwort #10 am: Mo 01.03.2021, 00:48:34 »
Textausgabe in Datei funktioniert nicht... mein System ist übrigens W10

Hier als Beispiel:

sdo-tool.exe -F txt GEMNI01.SDO -- Gemini.txt

Gibt alles in einem Rutsch auf dem Bildschirm aus...

Also Rückgabewerte von sdo-tool plus alle 90 Seiten als txt aber teils mit Parametern wie <b></b> für bold etc. also kein reiner Text. Eine Gemini.txt-Datei wird auch nicht erzeugt. "Ein umleiten der Bildschirmausgabe in eine Datei ist bestimmt möglich aber wohl nicht im Sinne des Erfinders und dann müßte man alles störende von Hand raus löschen"
Das steht auf meiner TODO-Liste. Mit diesem Konsolen-Dump hat alles angefangen und die aktuelle Ausgabe ist so eine Mischung aus lesbar und vollständig von dem was die Signum!-Datei enthält. Brauchbar ist es hauptsächlich, wenn man die Ausgabe in einem Pager (bspw. "less") ansieht. Gibt's unter Windows aber soweit ich weiß gar nicht.

Vermutlich werde ich mit der Zeit einfach so lange einzelne Teile hinter Kommandozeilenflags verbergen, bis nur noch Text übrig ist, dann fehlen halt Formeln, Tabellen, Bilder, etc. Wer im Moment einen Plain-Text Export haben will, dem würde ich empfehlen HTML zu nehmen und einfach Alles Auswählen – Copy&Paste zu machen.

Das unpraktische am Plaintext ist, dass man für relativ viel Aufwand (Unicode Mapping-Dateien) relativ schlechte Ergebnisse bekommt (keine Formeln / absolute Positionierung) und trotzdem die Fonts braucht, damit sowas wie die Leerzeichenerkennung funktioniert. Außerdem ist ein ASCII Export das einzige was Signum!2 selber kann.

Positives anderes Beispiel:

sdo-tool.exe -F html GEMNI01.SDO -- Gemini.html

Ergibt eine wirklich sehr schöne HTML-Datei die sehr gut im Browser lesbar ist.
Danke  :)

Offline Arthur

  • Benutzer
  • Beiträge: 10.302
  • Mein Atari erinnert mich an die gute alte Zeit..
Re: Signum!2 Datei-Konverter
« Antwort #11 am: Mo 01.03.2021, 01:01:23 »
Wer im Moment einen Plain-Text Export haben will, dem würde ich empfehlen HTML zu nehmen und einfach Alles Auswählen – Copy&Paste zu machen.

Gute Idee.