ein PDF-Dokument mit x A4 Seiten in zwei Hälften (A 5) teilen: mit Adobe, Briss u. Co?

was sonst nirgends hineinpasst

Moderator: Moderatoren

Benutzeravatar
lin
*****
Beiträge: 346
Registriert: So, 19.09.2010 19:05

ein PDF-Dokument mit x A4 Seiten in zwei Hälften (A 5) teilen: mit Adobe, Briss u. Co?

Beitrag von lin »

Hallo Zusammen,

ein PDF-Dokument mit x A4 Seiten in zwei Hälften (A 5) teilen: mit Adobe, Briss u. Co!? Welche Tools oder Verfahren eignen sich hier am besten?

Muss ein Scan mehrerer hundert Seiten der als A4 vorliegt in zwei gleich große Teile (A5) aufteilen. Das habe ich noch nie gemacht - und leider habe ich auch keine ADOBE-Spetailtools hier - dafür aber einen Linux und einen Windows-Rechner:

Die Aufgabe: von A4 nach A 5
briss_200.jpg
briss_200.jpg (26.9 KiB) 11461 mal betrachtet
hier noch ein Bild:
briss_300.jpg
briss_300.jpg (109.99 KiB) 11461 mal betrachtet
Zu den Optionen habe ich mich gestern kurz eingelesen: Es gibt einige Verfahren und Tools - aber die (aktuelle) Lage ist etwas unübersichtlich - die Hinweise und Techniken z.T. auch etwas in die Jahre gekommen. Deshalb hier ide Frage, ob Ihr denn ein Verfahren kennt, das hier angewandt werden kann!?

was ich bis dato zusammengetragen habe - ein bisheriger Überblick auf die Tools und Techniken bzw. die Software (die man hier einetzen kann)_

- Acrobat: Split ONE PDF page down the middle into TWO new pages (Acrobat XI Pro), can it be done?
https://community.adobe.com/t5/acrobat/ ... anguage=de

Die Diskussion der versch. tools - Briss / Adobe Acrobat etc. etx:

a. How can I split in half a double-page scanned PDF in a single pass? https://superuser.com/questions/791022/ ... ingle-pass
Split ONE PDF page down the middle into TWO new I have a scanned course and it has two pages, consecutive are showing as one page, how can I automatically split all the pages in one pass. Usually this is done by cropping odd and even pages and then merge them back together but this could take very much? How can I split pages on scanned PDF in a single pass? pdf adobe-acrobat There's an excellent, free and open source tool called Briss. It is very simple, user friendly and effective. It works on multiple operating systems through Java. Load your PDF into the app. The app will group similar pages together and lay them on top of each other. Draw rectangles on top of your pages so that they cover what you want included. It will look like this:....
b. How to split a PDF page into 2 pages? https://superuser.com/questions/1345953 ... to-2-pages
You can also use a tool such as PDF Split & Merge (PDF SAM) which has built-in split and merge functions and is quite simple to use and has a free version which I have personally used for some time. First you'd create a PDF of a blank page using a PDF Printer such as in the 1st option above. Then you use PDF SAM's split function to split your PDF into two pages. Then you'd use PDF SAM's merge function to add the blank page you created first to each of the 2 PDFs you created using the split function. So the entire process would look like this: Open your document editor and create a new blank document. Print this document using the PDF printer on your computer. Save it as BlankPage.pdf. Open the 2-page PDF using PDF SAM and split this by individual pages into pg1.pdf and pg2.pdf. Open pg1.pdf in PDF SAM and use the merge function to add BlankPage.pdf as the second page. Repeat step 4 using pg2.pdf.

wie oben bereits festgestellt sind diese Diskussionen bereits schon 5 Jahre alt oder älter...


Die Tools:
- Briss - 0.8 Briss PDF cropping tool. leider im Mai 2013 zum letzen Mal updatet https://sourceforge.net/projects/briss/

- und hier noch: ein Update auf Briss: Briss 2.0 is intended to be a GUI Update for the Briss PDF cropping tool.
https://github.com/mbaeuerle/Briss-2.0

- PDF-Sam: https://pdfsam.org/download-pdfsam-basic/


Wie würdet ihr ansetzen - wie vorgehen!?
Interessen: Linux & SBC https://www.allaboutcircuits.com :: die neuen Knowledge-Base: AFFiNE: There can be more than Notion and Miro. auf affine.pro :: WordPress Ressourcen Entwicklung: auf make.wordpress.org/core/
Benutzeravatar
miesepeter
********
Beiträge: 2097
Registriert: Sa, 10.05.2008 15:05
Wohnort: Bayern

Re: ein PDF-Dokument mit x A4 Seiten in zwei Hälften (A 5) teilen: mit Adobe, Briss u. Co?

Beitrag von miesepeter »

Hallo!

Die Scans sind ja blödsinnigerweise im PDF-Format wiedergegeben. Ich würde sie im Rastergraphik-Format "ausdrucken"/konvertieren, Seiten verdoppeln und dann mit einem geeigneten Programm (z.B. XnView) im Batch-Modus beschneiden und schließlich wieder per Batch-Druck als PDF-Dokument ausgeben.
Hier ist natürlich Planung die halbe (wenn nicht sogar ganze) Miete.

Wenn du unbedingt die PDF-Seiten beschneiden möchtest, dann verwende unter Linux die Version 4 von MasterPDF, das kann das. Version 4 deswegen, weil dann kein Wasserzeichen eingefügt wird. Weiteres Vorgehen sinngemäß wie oben...

Ciao
Benutzeravatar
lin
*****
Beiträge: 346
Registriert: So, 19.09.2010 19:05

Re: ein PDF-Dokument mit x A4 Seiten in zwei Hälften (A 5) teilen: mit Adobe, Briss u. Co?

Beitrag von lin »

hallo Miesepeter,

vielen Dank für deine schnelle Antwort.- Der Drucker hat die SCANs so an den R echner geschickt - als PDF. Es ist ein Canon C 5235i - fraglich ob ich hier in die Chain noch hätte eingreifen können. GGF. ja schon.

Frage: hab ich denn bei dem Weg jetzt erhebliche Qualitätsverluste? - also wenn ich die PDF so wie du beschreibst zerschneide?
miesepeter hat geschrieben: Do, 16.04.2020 08:49 Hallo!

Die Scans sind ja blödsinnigerweise im PDF-Format wiedergegeben. Ich würde sie im Rastergraphik-Format "ausdrucken"/konvertieren, Seiten verdoppeln und dann mit einem geeigneten Programm (z.B. XnView) im Batch-Modus beschneiden und schließlich wieder per Batch-Druck als PDF-Dokument ausgeben.

Wenn du unbedingt die PDF-Seiten beschneiden möchtest, dann verwende unter Linux die Version 4 von MasterPDF, das kann das. Version 4 deswegen, weil dann kein Wasserzeichen eingefügt wird. Weiteres Vorgehen sinngemäß wie oben...
Ciao
klar - das ist schon klar - jetzt wo du das sagst.
Hier ist natürlich Planung die halbe (wenn nicht sogar ganze) Miete.
Leuchtet ein - dir jedenfalls schonmal vielen Dank!!


Lin
Interessen: Linux & SBC https://www.allaboutcircuits.com :: die neuen Knowledge-Base: AFFiNE: There can be more than Notion and Miro. auf affine.pro :: WordPress Ressourcen Entwicklung: auf make.wordpress.org/core/
Benutzeravatar
miesepeter
********
Beiträge: 2097
Registriert: Sa, 10.05.2008 15:05
Wohnort: Bayern

Re: ein PDF-Dokument mit x A4 Seiten in zwei Hälften (A 5) teilen: mit Adobe, Briss u. Co?

Beitrag von miesepeter »

lin hat geschrieben: Do, 16.04.2020 13:51Qualitätsverluste?
Das kommt auf das Ausgabeformat an. Das Ergebnis eines Scans ist zunächst immer eine Rastergrafik (Bitmap). Ein üblicher Scanner bietet z.B. folgende Ausgabeformate an: TIF, JPG, PDF.
  • PDF heißt nur, dass eine Rastergrafik in eine PDF-Datei als Inhalt eingebettet wird - es erschwert die spätere Verarbeitung.
  • TIF ist (optisch) verlustfrei; große Dateigröße
  • JPG ist verlustbehaftet, da es i.d.R. komprimiert wird (Artefakte) - kleine Dateigröße
Ich kann dir nur sagen, wie ich das mache; ich digitalisiere auch manchmal Broschüren.
  • Scan nach TIF; viele Einzeldateien.
  • XnView
    • Batchkonvertierung nach PNG (weniger Dateigröße)
    • Ausrichten und zuschneiden (manuell)
    • wenn's irgend geht: Veränderung von Gammawert und Kontrast im Batchverfahren, so dass einigermaßen gut lesbare Dokumente herauskommen.
    • Reduzierung der Farben auf 8 bzw. der Grauwerte auf z.B. 8 oder 16 (weniger Dateigröße) im Batchverfahren
    • 1 Seite Text im A4-Format hat dann ungefähr noch 150-700 kB.
  • Bei Bedarf: "Ausdrucken" nach PDF in eine Datei (das brauche ich eher selten).
Das ist natürlich auch eine Menge Arbeit, trotz einiger automatisierter Verfahren, aber das Ergebnis kann sich i.d.R. sehen lassen.

Wo und wie kann ich jetzt meine Seiten in der Mitte abschneiden/auftrennen? (Hierzu liegen bei mir kaum Erfahrungen vor)
Das kann m.M. nach auch XnView (Dateien zuschneiden). Hier wäre wichtig, dass alle Dateien gleich groß (Länge, Breite) sind. Auch das kann mit XnView eingestellt werden. Wenn gute Vorlagen produziert worden waren, kann das alles im Batchverfahren, also jeweils in einem Arbeitsgang, erledigt werden.

Die vorliegenden PDF-Dateien zu "halbieren" ist vermutlich nicht so gut, weil das Halbieren ja nur die Objekte (Rastergrafiken) verdeckt und nicht effektiv löscht oder abschneidet. Vielleicht kann Adobe das ja, aber das wirst du nicht kaufen wollen. - Ciao und viel Spaß beim Basteln
Benutzeravatar
lin
*****
Beiträge: 346
Registriert: So, 19.09.2010 19:05

Re: ein PDF-Dokument mit x A4 Seiten in zwei Hälften (A 5) teilen: mit Adobe, Briss u. Co?

Beitrag von lin »

moin - danke für die vielen Ideen, Tipps und Anregungen.


ich vergaß zu erzählen dass es sich bei mir um Schrift handelt - m.a.W. hier gibt es keine Farben. Ich habe also ggf. gegenüber deiner TIF-Formate eine Reduktion - aber ich würde mal sagen, dass ich mit

a. Qualität u.
b. meinem Workflow - auch ohne deine sicher interessanten Prozessschritte - hinkommen.

Wer mit Farbe arbeite hat natürlich ganz andere Daten - bei mir kannst du nur eins antreffen - Schwarz - oder Weiß: Wie viel Bandbreite da reinläuft. ich hab das mal schnell rausgerechnet:



Code: Alles auswählen


+--------------------------------+------------------------------------------+--------------------------------------------+
|                                |                                          |                                            |
|                                |                                          |                                            |
|Die 3 wichtigsten Scan-Arten:   |     mögliche Werte                       |                Bit/Bildpunkt               |
|                                |                                          |                                            |
+------------------------------------------------------------------------------------------------------------------------+
|                                |                                          |                                            |
|                                |                                          |                                            |
| Schwarz/Weiß:                  |     2hoch1 = 2	                        |                     1                      |
|                                |                                          |                                            |
+------------------------------------------------------------------------------------------------------------------------+
|                                |                                          |                                            |
|                                |                                          |                                            |
| Graustufen (SW-Foto):          |      2hoch8 = 256                        |                     8                      |
|                                |                                          |                                            +
+------------------------------------------------------------------------------------------------------------------------+
|                                |                                          |                                            |
| Farbe:	                     |      2hoch24    = 16 777 216             |                     24                     |
|                                |                                          |(je 8 für Rot, Grün, "Blau; "True Color")   |
|                                |                                          |                                            |
+------------------------------------------------------------------------------------------------------------------------+

conclusio: deine Scan-Dateien, vor allem wenn du in Farbe scannst, die werden natürlich leicht sehr groß.

um mal ein Beispiel zu machen: nehmen wir nur ein Bild, 10 cm x 15 cm, Farbe ( und nund überlegen wir - du scannst das in 24 Bit), 300 dpi da haste ruckzuck natürlich ne fette Datei zusammen → 6 MB.

Also: klar - man muss sich immer darüber im Klaren sein, was man da vor sich hat: ein Bild oder ein Text: was man mit der Datei machen will.
Dementsprechend muss man die Auflösung beim Scan dem geplanten Ausgabemedium anpassen, um keine unnötig großen Dateien zu erhalten.

Ich komm mit der Qualität gut klar…


Grüssle - lin ;)
Interessen: Linux & SBC https://www.allaboutcircuits.com :: die neuen Knowledge-Base: AFFiNE: There can be more than Notion and Miro. auf affine.pro :: WordPress Ressourcen Entwicklung: auf make.wordpress.org/core/
Hiker
******
Beiträge: 590
Registriert: Mo, 08.09.2014 21:34
Wohnort: Berlin

Re: ein PDF-Dokument mit x A4 Seiten in zwei Hälften (A 5) teilen: mit Adobe, Briss u. Co?

Beitrag von Hiker »

Hallo,

Ich hatte jetzt Mal Zeit mein ct-Archiv zu durchsuchen und einen Artikel über OCRmyPDF ausgegraben. Das Modul unpaper scheint anzubieten, was Du brauchst.

https://ocrmypdf.readthedocs.io/en/latest/advanced.html

Mfg, Jörn

Artikel in CT 26/2019 S.152

PS Mir stellt sich generell die Frage, ob OCR und Übernahme des Textes mich der sinnvollere Weg wäre, aber das kannst nur Du entscheiden.
Libre Office 6.3.1 (Win 10 Pro) / Libre Office 6.0.7 (Win8.1 Pro, Win 7 Pro) / AOO (Win 7)
Benutzeravatar
lin
*****
Beiträge: 346
Registriert: So, 19.09.2010 19:05

Re: ein PDF-Dokument mit x A4 Seiten in zwei Hälften (A 5) teilen: mit Adobe, Briss u. Co?

Beitrag von lin »

hallo Jörn,

vielen Dank für deine Antwort und den Hinweis - ich werde mit das Tool ansehen.
Hiker hat geschrieben: Sa, 18.04.2020 08:11 Hallo,

Ich hatte jetzt Mal Zeit mein ct-Archiv zu durchsuchen und einen Artikel über OCRmyPDF ausgegraben. Das Modul unpaper scheint anzubieten, was Du brauchst.

https://ocrmypdf.readthedocs.io/en/latest/advanced.html

Mfg, Jörn

Artikel in CT 26/2019 S.152

PS Mir stellt sich generell die Frage, ob OCR und Übernahme des Textes mich der sinnvollere Weg wäre, aber das kannst nur Du entscheiden.
- ich guck mir das an. Melde mich wieder.


Viele Grüße
Lin ;)
Interessen: Linux & SBC https://www.allaboutcircuits.com :: die neuen Knowledge-Base: AFFiNE: There can be more than Notion and Miro. auf affine.pro :: WordPress Ressourcen Entwicklung: auf make.wordpress.org/core/
Benutzeravatar
lin
*****
Beiträge: 346
Registriert: So, 19.09.2010 19:05

Re: ein PDF-Dokument mit x A4 Seiten in zwei Hälften (A 5) teilen: mit Adobe, Briss u. Co?

Beitrag von lin »

Hallo Jörn, hallo Miesepeter, hi @all,

wollte das noch mit Euch teilen: Habe das dann mit mupfd / mutool (s) gemacht: - auf einem Linux-Notebook auf der Kommandozeile

hier das Tool u. die Dokumentation: https://mupdf.com/docs/

pdftk kann zwar ein mehrseitiges PDF in Einzelseiten auftrennen (je Seite eine Datei),
aber nicht Doppelseiten „zerschneiden“. Dazu muss mupdf und die mupdf-tools her.

Code: Alles auswählen

apt install mupdf-tools
Ein einseitiges aber auch ein mehrseitiges PDF wird dann Seite für Seite in zwei Seiten vertikal zerschnitten [schnipp-schnapp] mit:

Code: Alles auswählen

mutool poster -x 2 input.pdf output.pdf 
Die Option -x2 sagt aus, dass das Dokument in der X-Achse in zwei Teile geteilt werden soll. Die Schnittachse ist dementsprechend in der Mitte von oben nach unten, damit links und rechts zwei gleich große Seiten entstehen.
das Tolle: man kann die Schnittachsen einfach in der kommandozeile festlegen - x und y Achsen lassen sich auf der Kommandozeile einfach mit verarbeiten u. festlegen.

Fazit: auf der Kommandozeile sind das für die 370 Seiten - vorliegend in 4 Tranchen genau vier Befehl

Ein Dokument in einzelne Seiten aufsplitten - das geht sehr schnell - das macht man dann mit pdftk

Code: Alles auswählen

pdftk input.pdf burst
Die Ausgabefiles finden sich dann schlicht im selben Verzeichnis als pg_0001.pdf, pg_0002.pdf usw.

vgl. auch hier: http://www.xundeenergie.at/linux/2017/0 ... al-teilen/

und die ganze Dokumentation:
a. weitere Kommandos: https://www.mankier.com/1/mupdf
b. das Tool: https://mupdf.com/docs/: MuPDF is an open source software framework for viewing and converting PDF, XPS, and E-book documents.
There are viewers for various platforms, several command line tools, and a software library for building tools and applications.

The command line tools are all gathered into one umbrella command: mutool.

For rendering and converting documents there are three commands available:

mutool draw: This is the more customizable tool, but also has a more difficult set of command line options. It is primarily used for rendering a document to image files.
mutool convert: This tool is used for converting documents into other formats, and is easier to use.
mutool trace: This is a debugging tool used for printing a trace of the graphics device calls on a page.
There are also several tools specifically for working with PDF files:

mutool show: A tool for displaying the internal objects in a PDF file.
mutool extract: Extract images and embedded font resources.
mutool clean: Rewrite PDF file. Used to fix broken files, or to make a PDF file human editable.
mutool merge: Merge pages from multiple input files into a new PDF.
mutool create: Create a new PDF file from a text file with graphics commands.
And finally, there is a tool for doing anything you can imagine:
mutool run: A tool for running Javascript programs with access to the MuPDF library functions.
Fazit: auf der Kommandozeile sind das für die 370 Seiten - vorliegend in 4 Tranchen genau vier Befehle - und fertig ist der Job.

dir Miesepeter, und dir Jörn nochmals vielen Dank für Eure Ideen, Tipps, Anregungen - für Euern Support hier und auch sonst.
Bin von diesem Forum wirklich begeistert. Es ist ein klasse Austauschort und hat mir schon soo viel geholfen.


VG Lin
Interessen: Linux & SBC https://www.allaboutcircuits.com :: die neuen Knowledge-Base: AFFiNE: There can be more than Notion and Miro. auf affine.pro :: WordPress Ressourcen Entwicklung: auf make.wordpress.org/core/
Thomas Mc Kie
******
Beiträge: 919
Registriert: Mo, 12.04.2010 00:37

Re: ein PDF-Dokument mit x A4 Seiten in zwei Hälften (A 5) teilen: mit Adobe, Briss u. Co?

Beitrag von Thomas Mc Kie »

Danke auch an dich, dass du die gefundene Lösung gepostet hast. Eventuell hilft dies ja zukünftig jemand mit einem ähnlichen Problem.
Antworten