rtf-import

Das Textverarbeitungsprogramm

Moderator: Moderatoren

Stephan
********
Beiträge: 12368
Registriert: Mi, 30.06.2004 19:36
Wohnort: nahe Berlin

Beitrag von Stephan »

Die Datei wird ohne Fehlermeldung geöffnet, ich sehe aber keinen Inhalt.
diese Beschreibung ist anders als in dem anderen post, dort siehst Du leeren Text
Was ist denn nun zutreffend? Denn leerer Text wäre möglicherweise Text in einem Bereich, was dann schon mal ein Hinweis wäre.
Ansonsten:
Ist im Navigator etwas zu sehen?
Was ist ggf. unter Datei>Eigenschaften>Statistik eingetragen?

Auf welche Art und Weise hast Du versucht die Datei zu öffnen?

Hast Du mal versucht die Datei mit einem Fremdprogramm zu öffnen UND unter neuem Namen als *.rtf zu speichern. Du beschreibst nur das Du als *.sdw gespeichert hast.

Hast Du versucht ein leeres Dokument zu öffnen und die *.rtf-Datei mit Einfügen>Datei einzufügen?
In welcher Datei und wo liegt der rtf-Filter? Weiß das jemand?

Nein ich weiß das nicht, nur wenn ich es in Erfahrung bringen könnte in wie fern würde das helfen?
Oder hat jemand 'ne Idee, an welcher Einstellung zu drehen ich versuchen könnte?
anhand der Fehler-Beschreibung habe ich bisher keine Idee.
In jedem Fall gibt es keine Einstellung die den RTF-Filter beeinflussen würde, falls Du das meinst. Zumindest keine bekannte, denn ich kann nicht ausschließen das es undokumentierte gibt.


Gruß
Stephan
Stephan
********
Beiträge: 12368
Registriert: Mi, 30.06.2004 19:36
Wohnort: nahe Berlin

Beitrag von Stephan »

nur wenn ich den Umweg über den Oldtimer so51 gehe, funzt alles, und zwar problemlos. Die Angabe der .sdw-Datei bezog sich darauf: rtf einlesen in (so51) und ohne irgendeine Änderung abspeichern als .sdw und dann kann alles, was oo zu bieten hat, diese Datei handlen. Du hast sicherlich recht, von mir genaue Beschreibung zu verlangen. Im Gegenzug erwarte ich dann aber auch genaues Lesen.


verstehe ich jetzt nicht. Du hast beschrieben das Du in SO5.1 öffnen kannst und als sdw speichern kannst und das sdw später in moderneren Versionen normal funktioniert.
Ich habe Dich gebeten in irgend einem Fremdprogramm zuöffnen also SO5.1 oder Word 2000, denn da geht es ja Deiner Auskunft nach auch:
denn: so5.1 kann die Datei fehlerfrei lesen, word2000 kann es, aber keine so-Version nach 5.1 kann es.
und als *.rtf zu speichern. Also öffne die Datei, sagen wir abc.rtf in SO5.1 und speichere sie als abc-1.rtf und mach das Gleiche in Word2000 und speichere unter abc-2.rtf.
Versuche die 2 Dateien abc-1 und 2.rtf in einer modernen SO-Version zu öffnen.
(es geht hier noch nicht um die Lösung, sondern nur um das Finden von Anhaltspunkten, denn ich habe noch keinerlei Vermutung)
oo starten, datei öffnen ---> Fehlanzeige


das zur Sicherheit wiederholen indem Du vor der Dateiauswahl explizit nur *.rtf-Dateien (und nicht alle oder Textdokumente) einstellst. Der Hintergrund ist das sich auf diese Weise manchmal widerspenstige *.txt in OOo öffnen lassen. Ob das bei *.rtf etwas bewirkt weiß ich nicht, aber geht doch schnell zu probieren.
Die Relevanz des Unterschieds zwischen meinen beiden Fallbeschreibungen: "leere Datei" und "Datei ohne Inhalt" leuchtet mir nach deinem Post noch nicht ein.


hattest Du auch nicht geschrieben, sondern 'leerer Text'. Da wir ja irgendwie nach einem Importfehler suchen hatte ich gedacht da könnte ein Textbereich sein (im Prinzip das gesamte Dokument) welcher einen ausgeblendeten Bereich darstellt, denn dann wäre der Text da aber nicht sichtbar (im Prinzip das was Du manuell mit Einfügen>Bereich + Ausblenden erzeugst). Und leerer Text klang für mich so als ob es genau das sein könnte. Bloß falls im Navigator kein Bereich angezeigt wird ist es das nicht, also hast Du das im Navigator (F5) geprüft?
Warum ich die Datei des Filters wissen will: Ich würde dann spaßeshalber mal gucken, ob ich oo den alten so-Filter unterjubeln kann.
Ja, verstehe. Kann ich leider nichts zu sagen.


Gruß
Stephan
Stephan
********
Beiträge: 12368
Registriert: Mi, 30.06.2004 19:36
Wohnort: nahe Berlin

Beitrag von Stephan »

Es tut mir leid, Du bist ganz offensichtlich nicht im Navigator.
Der Navigator ist das Fenser/der Dialog der erscheint wenn Du im Writer Taste F5 drückst. Und im Navigator stehen keine Dateinamen, sondern Dokumentbestandteile z.B. Grafiken, Tabellen, Überschriften...
und es gibt einen Eintrag Bereiche. Ist da ein Bereich eingetragen wäre meine Frage.


Gruß
Stephan
Stephan
********
Beiträge: 12368
Registriert: Mi, 30.06.2004 19:36
Wohnort: nahe Berlin

Beitrag von Stephan »

Habe Navigator mit über Symbolleistenklick und jetzt noch mal mit F5 gestartet. Ich muss gestehen, dass ich mit diesem Teil so gut wie nie arbeite, aber ganz unten im Navigatorfensterchen ist 'ne Ausklappbox, und in der steht: abc.rtf (aktiv).


Ich muß gestehen das ich ständig damit arbeite und mir noch nie aufgefallen ist das da unten der Dateiname steht. Aber Du bist richtig.
Oberhalb des Dateinamens ist "ein größeres" Fenster und da steht u.A. "Bereiche", davor kann ein Kästchen mit plus sein, klicke darauf das es aufklappt, dann müßte unterhab des Wortes Bereiche etwas stehen. Nämlich Namen von Bereichen, falls es bei Dir welche gibt, was ich nicht weiß. Wenn da eines oder mehrere stehen erzeuge darauf Kontextmenü und bearbeiten. Im erscheinenden Dialog deaktiviere Ausblenden.

Wenn das geht kann ich das hier:
werden 19 Absätze und 3197 Zeichen angegeben, aber 0 Zeilen.


bei mir nachvollziehen und das ist genau das was ich erwarten würde. Denn gibt es einen (oder mehrere) Bereiche und die sind ausgeblendet gibt das tatsächlich 0 Zeilen,weil nichts sichtbar. Blendest Du wie oben beschrieben die Bereiche ein, werden sie sichtbar und die Zeilenanzahl ist größer 0.

Könntest Du das nachvollziehen? Oder verhält es sich bei Dir anders?


Gruß
Stephan
pmoegenb
********
Beiträge: 4330
Registriert: Di, 22.06.2004 12:02
Wohnort: 71134 Aidlingen
Kontaktdaten:

Beitrag von pmoegenb »

Hallo Günther,

in der Tat scheint OO 1.1.4 seine Schwierigkeiten mit dem RTF-Format zu haben. Ich habe mich mal mit einer Grafik wie folgt beschäftigt.
  • 1. RTF-Datei mit einer Grafik mit Word 2000 erstellt, gespeichert und geschlossen.
    2. RTF-Datei mit Word 2000 geöffnet, die Grafik war noch da.
    3. RTF-Datei mit OO 1.1.4 geöffnet, die Grafik war weg.
    4. RTF-Datei mit einer Grafik mit OO 1.1.4 erstellt, gespeichert und geschlossen.
    5. RTF-Datei mit OO 1.1.4 geöffnet, die Grafik war weg.
Schritt 3 bis 5 habe ich dann mit dem Snapshot Build 1.9.m77 (680_m77) von OO 2 wiederholt. Die Schritte führten zu keiner Beanstandung. Die Grafiken waren jederzeit lesbar.

Anscheinend wurde der Bug von den Programmierern bemerkt und in der künftigen Version 2 abgestellt.

Gruß

Peter
Stephan
********
Beiträge: 12368
Registriert: Mi, 30.06.2004 19:36
Wohnort: nahe Berlin

Beitrag von Stephan »

Hallo Peter,
1. RTF-Datei mit einer Grafik mit Word 2000 erstellt, gespeichert und geschlossen.
2. RTF-Datei mit Word 2000 geöffnet, die Grafik war noch da.
3. RTF-Datei mit OO 1.1.4 geöffnet, die Grafik war weg.
4. RTF-Datei mit einer Grafik mit OO 1.1.4 erstellt, gespeichert und geschlossen.
5. RTF-Datei mit OO 1.1.4 geöffnet, die Grafik war weg.


Kann ich nicht nachvollziehen, geht bei mir problemlos.
Schritt 3 bis 5 habe ich dann mit dem Snapshot Build 1.9.m77 (680_m77) von OO 2 wiederholt. Die Schritte führten zu keiner Beanstandung. Die Grafiken waren jederzeit lesbar.

Anscheinend wurde der Bug von den Programmierern bemerkt und in der künftigen Version 2 abgestellt.


Hast Du die Nummer des Issues?
Ich finde keinen Issue der das Problem beschreibt und als behoben gekennzeichnet wäre. Es gibt anscheinend viele Duplikate die alle auf 3790 zurückzuverfolgen sind. Allerdings ist 3790 nicht als gefixt gekennzeichnet sondern als "later".
Das Einzige was ich gefunden habe was zur Thematik passt und für 2.0 als gefixt gekennzeichnet ist ist 30814. (wo es allerdings mehr um Textfelder geht)


Gruß
Stephan
Stephan
********
Beiträge: 12368
Registriert: Mi, 30.06.2004 19:36
Wohnort: nahe Berlin

Beitrag von Stephan »

Günther Ditthardt hat geschrieben:@stephan
Soll ich dir meine Beispieldatei mal zumailen?

Grüße, Günther
Ja mach das mal. Ob da was Sinnvolles herauskommt weiß ich aber nicht. Meine Email-Adresse habe ich Dir gerade über das Forum geschickt.


Gruß
Stephan
Stephan
********
Beiträge: 12368
Registriert: Mi, 30.06.2004 19:36
Wohnort: nahe Berlin

Beitrag von Stephan »

Hallo Günther,

Datei habe ich bekommen und der Sachverhalt ist weitestgehend klar und wahrscheinlich zu beseitigen. Ich kann die *.rtf öffnen und dann ist nichts sichbar (SO7 PP4). Ich kann jedoch den Inhalt der unsichtbaren Textfelder mit folgendem Code bequem auslesen:

Code: Alles auswählen

Public formFrame 
Public formCursor 

Sub test 
formCursor = ThisComponent.Text.createTextCursor() 
formCursor.gotoStart (false) 
formFrames = ThisComponent.getTextFrames() 
for i = 0 to formFrames.Count -1 
   formFrame = formFrames(i) 
   SW() 
next i 
formCursor.gotoEnd (true) 
End Sub 

sub SW() 
FrameCursor = formFrame.createTextCursor() 
FrameCursor.gotoStart (false) 
FrameCursor.gotoEnd (true) 
msgbox FrameCursor.String 
end sub
Das Einzige was, meiner Meinung nach, zu tun wäre wäre alle Eigenschaften von formFrame durchzugehen und die zu finden, welches das "Verstecktsein" bewirkt. Das ist sehr wahrscheinlich eine Bool-Eigenschaft, ich kann aber keine finden. Ich bin mir leider nicht im Klaren darüber was ein verstecktes Textfeld i.d.S. eigentlich ist, naja es ist ein Textfeld das sich verhält wie ein ausgeblendeter Bereich, nur da ist kein eigentlicher Bereich.
Du kannst das leicht auch manuell überprüfen. Im Navigator wähle Bei Textrahmen-->Kontextmenü-->Dragmodus Kopie einfügen (oder Verknüpfung). Dann kannst Du die versteckten Bereiche als sichbare Bereiche per Drag und Drop aus dem Navigator ins Dokument ziehen.
Sorry ich habe keine Zeit das zu untersuchen, es kann höchstens sein das ich eine schwache Stunde habe und das dann doch tue, dann werde ich Dir natürlich das Ergebnis senden.

Hat irgend jemand eine Ahnung welche Eigenschaft das "Verstecktsein" eines Textrahmens bewirkt? Eine explizite "Hidden"-Eigenschaft konnte ich mit .dbg_properties nicht finden.

In jedem Fall liegt es ausschließlich daran das der Text in Rahmen steht und das ist wohl so weil das OCR-Programm das Layout möglichst orginalgetreu erhalten will.



Gruß
Stephan
Hubi
**
Beiträge: 32
Registriert: Di, 25.01.2005 12:06
Wohnort: 21423 Winsen
Kontaktdaten:

Beitrag von Hubi »

Sorry wenn ich eine Frage habe sied ihr sicher das ihr es mit echtem RTF Format zu tun habt ?? Wenn ich mir einen Richtext im Hex Editor anschaue fängt dieser mit {\rtf1\ansi\ansi usw. an.

Vielleicht ist es ja was anderes ??

Könnte es vielleicht XML oder CSS sein ?

Gruß Hubi
Stephan
********
Beiträge: 12368
Registriert: Mi, 30.06.2004 19:36
Wohnort: nahe Berlin

Beitrag von Stephan »

Hubi hat geschrieben:Sorry wenn ich eine Frage habe sied ihr sicher das ihr es mit echtem RTF Format zu tun habt ?? Wenn ich mir einen Richtext im Hex Editor anschaue fängt dieser mit {\rtf1\ansi\ansi usw. an.

Vielleicht ist es ja was anderes ??

Könnte es vielleicht XML oder CSS sein ?

Gruß Hubi
Ja, wir sind sicher. Die spezifische Datei beginnt so:

Code: Alles auswählen

{\rtf1\ansi\ansicpg1252\uc1



Gruß
Stephan
pmoegenb
********
Beiträge: 4330
Registriert: Di, 22.06.2004 12:02
Wohnort: 71134 Aidlingen
Kontaktdaten:

Beitrag von pmoegenb »

Hallo Stephan,

Zu RTF-Dateien
Kann ich nicht nachvollziehen, geht bei mir problemlos.
Geht bei mir leider nicht. Mir ist schon öfters aufgefallen, dass OO 1.1.4 einiges verschwinden lässt, wenn man die Datei als RTF abspeichert. Nur, diesmal wollte ich es genau wissen. Ob dies mit dem Betriebssystem (Windows XP SP 2) zusammenhängt vermag ich nicht zu beurteilen.
Hast Du die Nummer des Issues?
Nein, hab ich nicht, deshalb habe ich anscheinend geschrieben.

Gruß

Peter
Hubi
**
Beiträge: 32
Registriert: Di, 25.01.2005 12:06
Wohnort: 21423 Winsen
Kontaktdaten:

Beitrag von Hubi »

Sorry hatte mich vergessen abzumelden, kommt vor wenn man auf der Arbeit ist
Stephan
********
Beiträge: 12368
Registriert: Mi, 30.06.2004 19:36
Wohnort: nahe Berlin

Beitrag von Stephan »

Hallo,

Du bist hier schon richtig wenn Du mithelfen willst, bloß Sorry, Du spekulierst doch ausschließlich.
Ich habe einige Musterdateien mit RTF und in dem RTF eingebeteten CSS Elementen.
Mag sein
Dies scheint bei dir denke ich der Fall zu sein.
Woher weißt Du das?
Die Anweisungen sehen bei dir wie CSS Elemente aus
wo stehen denn hier irgendwo solche Anweisungen?


Frag doch mal Günther ob er Dir auch die entsprechende Datei per Email schickt, dann kannst Du Dir das selbst mal ansehen.


Gruß
Stephan
Stephan
********
Beiträge: 12368
Registriert: Mi, 30.06.2004 19:36
Wohnort: nahe Berlin

Beitrag von Stephan »

@stephan, was meinst du, ist das nun ein bug oder nicht?


Ich habe das Problem heute morgen auf der users-Liste zur Diskussion gestellt. Bisher habe ich 2 Antworten die jedoch keine Lösung bringen.
Deine Datei funktioniert bei mir auch nicht, das hatte ich geschrieben. Ja und klar ist da ein Bug. Bloß in wieweit ist das reproduzierbar? Ich kann weder die Fehlfunktionen bestätigen welche Peter beschreibt noch hatte ich auffällige Probleme mit SO/OOo und *.rtf in den letzten Monaten. Ich kriege es auch nicht hin Fehler mit *.rtf zu provozieren, wenn ich ganz allgemein *.rtf in word anlege.
Also so ist der Stand der Dinge, und ich hoffe bisher das ich über die users-Liste doch noch etwas in Erfahrung bringen kann.
Ich habe Dich doch soweit richtig verstanden, das es keine Datei gibt an deren Inhalt Du nicht kommst, da Du ja den Umweg über SO5.1 nehmen kannst. Weil das Makro hatte ich nur geschrieben um die Datei zu analysieren, damit könnte man im Notfall jedoch auch den reinen Text aus den Textfeldern auslesen, wenn Du anders nicht an die Inhalte kämst. Bloß das ist doch nicht der Fall, oder?

Gruß
Stephan
Stephan
********
Beiträge: 12368
Registriert: Mi, 30.06.2004 19:36
Wohnort: nahe Berlin

Beitrag von Stephan »

Die Grafik in cicero.rtf habe ich auf diese Weise aber nicht sichtbar machen können
ich auch nicht
Und so langsam beschleicht mich dann halt auch die Angst, dass, wenn Schluss ist mit *.sdw, dann auch dieser Umweg verbaut ist.
die Gefahr sehe ich nicht, warum sollte das passieren (version 5.1 hast Du und die Importfilter für *.sdw für höhere Versionen sind alle OpenSource so das sie dauerhaft verfügbar sind und bleiben)
Und 3. bin ich als eingefleischter oo-User natürlich brennend daran interessiert, dass "unser" Prog nicht hinter M$ zurücksteht.


was dann aber heißt das das OCR-Programm das auch tun müßte, also *.sxw liefern. Das ist ein generelles Problem das viele Programme die eine "Anbindung" an Office-Software brauchen diese nur als Anbindung an MS realisieren. Bloß das hat dann ebend etwas mit der Verbreitung zu tun.
Ich problier mal selber den Fehler mit *.rtf in word zu reproduzieren. Wenn's dir recht ist ,schick ich dir die Ergebnisse wieder zu.


Du kannst das tun, bloß es wäre besser wenn Du das hier veröffentlichst dann haben alle was davon.


Insgesamt:
-ich weiß das es Probleme mir *.rtf gibt
-ich habe versucht Dein Problem zu analysieren und dafür eine Lösung zu finden, da kam ich nicht weiter und habe auf der Liste gefragt bisher ohne Ergebnis - wenn ich eine passende Antwort bekäme würde ich Dir ein Makro schreiben was das Problem löst. Wenn ich alles alleine analysieren muß brauchte ich dafür sehr viel Zeit, die ich nicht habe und hoffe deshalb auf der Liste eine Antwort zu bekommen, dann wäre der Rest schnell als Makro geschrieben
-ich finde reichlich issuses zur Problematik *.rtf/OOo von denen viele noch nicht gefixt sind. Da das so ist muß ich zunächst davon ausgehen das der Fehler schon bekannt ist. Um das definitiv sagen zu können müßte ich alle issues detailliert untersuchen icl. aller Zusatzmaterialien wozu ich keine Zeit habe. Die Situation wäre nur dann einfach wenn alle bekannten issues schon gefixt wären, denn dann könnte ich sagen: da ist ein Fehler der noch nicht bekannt ist (issues ist der Begriff für Fehlermeldungen bzw. Verbesserungswünsche)
-falls Du irgendwie den Eindruck hast ich wäre mit der Entwicklung von OOo beschäftigt oder hätte Kontakte zu Entwicklern oder was auch immer dann muß ich sagen ich bin nur einfacher OOo-Benutzer wie Du der einen Teil seiner Freizeit verwendet um hier im Forum Fragen zu beantworten


Vielleicht wäre es auch mal einen Versuch wert eine andere OCR-Software zu verwenden.



Gruß
Stephan
Antworten