Text automatisch neu formatieren / Absätze entfernen

Antwort erstellen


BBCode ist eingeschaltet
[img] ist ausgeschaltet
[url] ist eingeschaltet
Smileys sind ausgeschaltet

Die letzten Beiträge des Themas
   

Ansicht erweitern Die letzten Beiträge des Themas: Text automatisch neu formatieren / Absätze entfernen

Re: Text automatisch neu formatieren / Absätze entfernen

von MWi » Mi, 17.11.2010 10:20

Hallo Frank,
Frank hat geschrieben:Anscheinend bleibt mir keine andere Möglichkeit als jedes Dokument langsam und Fehlerträchtig per Hand zu bearbeiten
vielleicht kannst Du das händische Nacharbeiten mithilfe der "Suchen & Ersetzen-Funktion" ein wenig unterstützen:
  1. Funktion "Suchen & Ersetzen aufrufen"
  2. Unter "Suchen nach" eingeben: $
  3. Unter "Ersetzen durch" entweder keine Eingabe (für den Fall, dass im Text vor den Absatzumbruchzeichen bzw. am Zeilen-(Absatz-)anfang ein Leerzeichen steht) oder - falls kein Leerzeichen steht: ein "Leerzeichen" eingeben
  4. Über den Schalter "Mehr Optionen" die Auswahl auklappen und "Regulärer Ausdruck" auswählen
  5. Starten mit dem Schalter "Suchen" (Programm markiert das erste gefundene Absatzumbruchzeichen
  6. Mit dem Schalter "Ersetzen" dann entweder jede "Zeile" einzeln durchlaufen oder
  7. vor Start der Suchen & Ersetzen-Funktion einen Textblock markieren, dann
  8. zusätzlich zu "Regulärer Ausdruck" noch "nur in Selektion" auswählen.
Am besten "spielst" Du ein bisschen mit einem Probetext herum und schaust Dir die jeweiligen Ergebnisse an.

Eine "vollautomatische" Lösung kann ich leider nicht anbieten. Aber vielleicht hilft Dir das trotzdem.

Freundliche Grüße

Michael

Re: Text automatisch neu formatieren / Absätze entfernen

von Stephan » So, 14.11.2010 12:40

PDF/A-1a


Das ist scheinbar der gesamte Grund. Ja, das kann ich hier nachvollziehen.

Deaktiviere einmal diese Option, dann siehst Du das dann jede Zeile im PDF ein separater Absatz ist.


Danke für die Infos.

Gruß
Stephan

Re: Text automatisch neu formatieren / Absätze entfernen

von pmoegenb » So, 14.11.2010 12:31

Hallo Stephan,
Ich erstelle meine Programm-Dokumentationen mittels OOo und erstelle daraus über Exportieren als PDF (PDF/A-1a mit Lesezeichen) eine PDF-Datei. Aus dieser PDF-Datei habe ich das Kopieren/Einfügen in ein Writer-Dokument getestet (siehe
Testdokument.pdf
(57.4 KiB) 55-mal heruntergeladen
).
Daraus resultierte mein 1. Post.

Für Testzwecke habe ich aus derselben Programm-Dokumentation eine PDF-Datei mittels PDF-Creator erstellt und ebenfalls das Kopieren/Einfügen in ein Writer-Dokument getestet, wobei dann das Absatzverhalten dem von Frank entsprach.

Re: Text automatisch neu formatieren / Absätze entfernen

von Stephan » So, 14.11.2010 12:08

Hallo Peter,
ich habe das natürlich nicht ungetestet geschrieben.
Das hatte ich auch nicht angenommen. Ich habe lediglich deutlich gemacht das das beschriebene Verhalten mir völlig unbekannt ist, was nicht wegen meiner Person von Bedeutung ist, sondern weil ich das Verhalten auch viele Dutzende Male von anderer SEite bestätigt bekam.
Getestet wurde mit Foxit-Reader 4.2.0.0928 und Acrobat-Reader 9.4.0. Ich kann die PDF-Datei mit 2,3 MB schlecht hochladen.
Das ist jetzt nicht mehr von Bedeutung, da eine Deiner hier angehängten 2 PDF-Dateien in einem Absatz das Verhalten zeigt was mir bisher unbekannt war und ein Beleg reicht ja völlig aus um das Ganze klar zu beweisen.
Aufgrund Deine Zweifel habe ich die Seite mit dem entsprechenden Text mit dem PDF-Creator erstellt und siehe da, das Verhalten ist plötzlich identisch.
Ich kann das Verhalten, von dem ich glaubte es existiere nicht, im Dokument PDF_Ergebnis.pdf nachvollziehen.
Da dort auch ein Teil existiert, welcher augenscheinlich in OOo erstellt wurde (blau umrandet in Abbildung) möchte ich Dich bitten schrittweise zu beschreiben wie Du dabei vorgegangen bist, damit ich versuchen kann das Ganze hier nachzuvollziehen.



Danke schonmal für Deine bis hierher bereits sehr interessanten Hinweise.


Gruß
Stephan
Dateianhänge
beispiel..GIF
beispiel..GIF (11.79 KiB) 1775 mal betrachtet

Re: Text automatisch neu formatieren / Absätze entfernen

von pmoegenb » So, 14.11.2010 11:38

Hallo Stephan,
ich habe das natürlich nicht ungetestet geschrieben. Das Verhalten habe ich mit einer in OOo erstellten PDF-Datei festgestellt. Getestet wurde mit Foxit-Reader 4.2.0.0928 und Acrobat-Reader 9.4.0. Ich kann die PDF-Datei mit 2,3 MB schlecht hochladen.

Aufgrund Deine Zweifel habe ich die Seite mit dem entsprechenden Text mit dem PDF-Creator erstellt und siehe da, das Verhalten ist plötzlich identisch.
PDF_Ergebnis.pdf
(49.05 KiB) 62-mal heruntergeladen
Spendenverwaltung_V61.pdf
(15.35 KiB) 54-mal heruntergeladen
Daraus schließe ich, dass das Verhalten auch vom Erstellungswerkzeug abhängig ist.

Re: Text automatisch neu formatieren / Absätze entfernen

von Stephan » So, 14.11.2010 10:58

ich glaube es liegt an dem von Dir benutztem PDF-Reader.
das glaube ich nicht, denn egal welchen Reader man verwendet er kann nichts anzeigen (oder beim Kopieren übertragen) was garnicht Bestandteil des PDF ist. UNd Absätze sind nicht Bestandteil des PDF, weil bei der PDF-Erzeugung jede ZEile in eine Absatz umgewandelt wird.
Benutze ich stattdessen den Acrobat Reader ist alles OK.
Ich benutze praktisch nur Acrobat Reader und trotzdem ist das ERgebnis so wie beschrieben, es besteht auch keine andere Möglichkeit, wel im PDF garkeine Absätze mehr vorhanden sind bzw. es ist jede Zeile ein Absatz, womit ursprünglich vorhandene Absätze nicht mehr rückermittelbar sind.


Solltest Du tatsächlich andere ERfahrungen haben (ich glaube eindeutig nicht daran) dann stelle bitte ein entsprechendes Pdf zur Verfügung und nenne die genaue Version des Readers un DEine genaues Vorgehjen beim Kopieren ´mit dem Du zum benannten ERgebnis kommst.



Gruß
Stephan

Re: Text automatisch neu formatieren / Absätze entfernen

von pmoegenb » So, 14.11.2010 10:01

Hallo Frank,
ich glaube es liegt an dem von Dir benutztem PDF-Reader.

Wenn ich den Foxit-Reader benutze erhalte ich beim Kopieren/Einfügen das von der beschriebene Absatzergebnis. Benutze ich stattdessen den Acrobat Reader ist alles OK.

Re: Text automatisch neu formatieren / Absätze entfernen

von Stephan » So, 14.11.2010 00:53

Daß ich die Rechtschreibfehler manuell korrigieren muß, ist mir relativ klar, da die wenigsten dieser Wörter durch die Rechtschreibkorrektur als Fehler angezeigt werden und die Originaldokumente in alter Rechtschreibung verfasst sind und so beinahe jedes Wort mit einem ß angemäkelt wird.
UNd was ist nun gemeint? Entweder es werden die wenigsten Wörter als Fehler angezeigt oder es wird benahe jedes Wort mit ß angemäkelt?
Gibt es eine Möglichkeit, das Ganze irgend wie zu automatisieren und zu vereinfachen?
Nein, denn im PDF-Dpolkument sind keine Inormationen mehr vorhanden wo ursprüngliche Absätze begannen und endeten.
Bestenfals ließen sich also alle Absatzumbrüche entfernen, so das das ganze Dokument nur noch aus einem Absatz bestünde, was aber wohl nicht das Ziel sein kann.



Gruß
Stephan

Nach oben