Seite 1 von 1

Eingescanntes PDF nach in Calc einsortieren

Verfasst: Do, 02.04.2015 22:58
von Stefanie
Hallo,

ich habe ein PDF mit Multiple Choice Fragen eingescannt und mit der OCR Software in Text umgewandelt.

Der Aufbau des Files ist wie folgt:

3-stellige Nummer: Frage
a) Antwort 1
b) Antwort 2
c) Antwort 3

3-stellige Nummer: Frage
a) Antwort 1
b) Antwort 2
c) Antwort 3
...
usw.

Nun möchte ich die einzelnen Elemente in ein Calc-File einordnen und zwar in der 4. Spalte die Frage, in der 7. Die Antwort a), in der 10. die Antwort b) und in der 13. die Antwort c).

Da das File ziemlich lang ist, werde ich mit der Korrektur der falsch eingelesenen Elemente noch genug zu tun haben. Darum würde ich das Einsortieren gerne automatisieren.

Habt Ihr einen Tipp wie das gehen könnte?

Re: Eingescanntes PDF nach in Calc einsortieren

Verfasst: Do, 02.04.2015 23:05
von Stefan HE
Guten Abend Stefanie,
verstehe ich das richtig, dass dieser umgewandelte Text noch nicht in einer Calc-Tabelle drin ist? (Also müsste der Text noch importiert werden?)
Wie gleichmäßig arbeitet das Umwandlungsprogramm, also ich meine, kannst du dich darauf verlassen, dass immer nach z.B. 5 Zeilen die nächste 3-stellige Nummer kommt?

Gruß,
Stefan

Re: Eingescanntes PDF nach in Calc einsortieren

Verfasst: Fr, 03.04.2015 06:31
von clag
Hallo Stefanie,

du könntest die Text Datei in einen leistungsfähigen Texteditor (zB Notepad++) laden und mit suchen ersetzen das Problem lösen,
zB suchen \r\na\) ersetzen ;a\) also die Textdatei in eine CSV Tabelle umwandeln und importierst dann diese 4 Spalten.

Oder du importierst diesen Text gleich einspaltig in Calc und mit der Funktion INDIREKT() oder VERSCHIEBUNG()
ordnest du den Inhalt wie gewünscht an.
Zellen_neu_anordnen.ods
(10.71 KiB) 93-mal heruntergeladen