Acrobat: gescannte Documente nach OCR als PDF/A-2b speichern

Hallo!
Ich nutze OSX 10.8.3 und Acrobat Professional XI (11.0.2).
Ich versuche folgenden Ablauf zu realisieren:
Objekte werden in OSX gescannt und in einem bestimmten Ordner abgelegt.
Dann werden in einer Acrobat Aktion die scane "optimiert", also komprimiert und Text per OCR erkannt.
Diese sobearbeiteten Dateien sollen in der gleichen Aktion als PDF/A-2b gespeichert werden.
Hier mein Problem:
Jedes mal wenn ich ein gescanntes und optimiertes Dokument (in dem also per OCR Text hinterlegt ist) in ein PDF/A-2 umwandeln möchte geht dabei der hinterlegt, durchsuchbare Text verloren!
Ich habe schon mehrere Varianten mit verschiedenen Einstellungen ausprobiert ("speicerhn al", Preflight,...), alle führen jedoch zu dem gleichen Ergebnis: Ich erhalte deutlich größere Dateien die aber keinen durchsuchbaren Text enthalten.
Die Umwandlung in PDF/A-1b war erfolgreicht. Ich möchte aber gerne - vor allem wegen der Nutzung von JPG2000 in PDF/A-2b oder PDF/A-2u konvertieren. Beides sollte meiner Meinung nach problemlos möglich sein und eigentlich den OCR-Text erhalten.
Wo ist hier das Problem?
Ist das ein Fehler im Acrobat?
Mache ich etwas falsche, übersehe ich etwas?
Vielen Dank!

Hallo!
Das Problem besteht nach 9 Monaten unter 10.9.2 mit Acrobat Pro 11.0.06 immer noch!
Das Hauptproblem scheinen von Acrobats OCR erzeugte .notdef-Glyphen zu sein.
Die können von Preflight nicht ersetzt werden, daher wirde jede Seite via PostScript rekonvertiert und der unsichtbare OCR-Text verworfen.
Da PDF/A-2 und PDF/A-3 keine .notdef-Glyphen mehr erlauben ist dies natürlich ein großes Problem und hätte schon lange behoben werden müssen!
Im Preflight-Preset für die PDF/A-2 Konvertierung existiert eine Korrektur die alle .notdef-Glyphen ersetzen soll. Diese Korrektur hat jedoch (auch wenn man ein Benutzerdefiniertes Profil mit dieser Korrektur erstellt) keinerlei Auswirkung auf das Dokument und die Glyphen!
Eigentlich sollte OCR vermutlich überhaupt keine .notdef-Glyphen verwenden. Und dann sollte natürlich die Preflight-Funktion funktionieren!

Similar Messages

  • Acrobat Pro 9.2 + IE8 zeigt einige Web Seiten nicht als PDF Datei an

    Hallo,
    wenn ich z.B. bei einer Fahrplanauskunft einen Fahrplan anzeigen lassen will, wird mir dieser als PDF Datei angeboten.
    Wenn ich nun diesen Fahrplan anzeigen lassen will, erhalte ich im IE 8 das folgende:
    Es wird eine neue Registerkarte geöffnet, doch dann steht da:
    Die Registerkarte wurde wiederhergestellt.
    Sie konnten nicht zu xyz.de wechseln.
    Die Wiederherstellung dieser Website wurde beendet. Offenbar bestehen weiterhin Probleme mit dieser Website.
    Wenn eine Website einen Fehler oder einen Absturz verursacht, versucht Internet Explorer, die Site wiederherzustellen. Nach zwei Versuchen wird die Wiederherstellung beendet, um eine Endlosschleife zu vermeiden.
    Und das war es dann auch. Die Seite wird nicht angezeigt.
    Ich nutze den Adobe Acrobat Pro 9.2 unter Windows 7 32 bit.
    Eine Reparatur des Adobe Acrobat 9.2 Programms hat nichts gebracht. Hatte ich auch nicht gedacht, da ja 95% aller Web Seiten, in denen ich ein PDF Dokument aufrufen will, einwandfrei funktionieren.
    Es ist aber nicht so, als wäre das grundsätzlich bei allen ähnlichen Seiten mit ähnlichen PDF Dateien, sondern immer nur bei einigen wenigen.
    Und im FireFox funktioniert es IMMER grundsätzlich.
    Woran kann das liegen und vor allem, wie kann ich das im IE8 auch dauerhaft beheben?
    Danke für Eure Hilfe.

    Womit eine Datei geöffnet wird ist Sache des Betriebssystems.
    Das heißt, die Auswahl des Standardprogramms muss bei jedem Rechner individuell eingestellt werden.
    MfG
    us-hh

  • Beim Erstellen eines PDF in WORD MAC 2008 über Drucken/als PDF speichern sehe ich Schriftart DIN Light/Medium (in Textfeld gesetzt) im Acrobat keine Buchstaben

    Beim Erstellen eines PDF in WORD MAC 2008 über Drucken/als PDF speichern sehe ich mit der Schriftart DIN Light/Medium (in Textfeld gesetzt) im Acrobat keine Buchstaben sondern erhalte ein weißes Blatt und eine Fehlermeldung: "Die eingebettete Schrift "ADMRRZ+DIN-Light" konnte nicht entnommen werden. Einige Zeichen werden u. U. nicht korrekt angezeigt bzw. gedruckt." Bei jedem Speichern stehen vor "DIN-Light" neue Hyroglyphen. Auch werden einige Symbole (eingefügte Pictogramme) nicht korrekt angezeigt. Wenn ich das PDF in Vorschau vom Mac öffne, ist (bis auf die Symbole) alles ok. Wenn ich ein PDF aus IND CS6 schreibe, funktioniert es mit der gleichen Schrift ohne Probleme. Das Problem besteht seit den beiden letzten Updates von Acrobat X.

  • Adobe Acrobat CS4 unter Windows 7 x64 als PDF drucken

    Hallo,
    habe im Moment Probleme ein Wordfile als PDF zu drucken. Bekomme folgendes Log
    %%[ ProductName: Distiller ]%%
    Cambria not found, using Courier.
    %%[ Error: invalidfont; OffendingCommand: xshow ]%%
    Stack:
    [271 216 365 125 246 99 302 100 357 234 246 125 147 234 183 124 247 0]
    %%[ Flushing: rest of job (to end-of-file) will be ignored ]%%
    %%[ Warning: PostScript error. No PDF file produced. ] %%
    Kann mir jemand helfen? Danke

    Das verstehe ich ja auch nicht, warum es unter Win 7 nicht funktionieren sollte. Derzeit sehe ich nur das Adobe-Symbol.
    Was meinst du mit anknipsen ? Das meine pdf's vorschaugerecht sind habe ich ja unter XP gesehen.
    (bin ca. vor 3 Wochen von XP auf 7 umgestiegen)
    Gibt es vielleicht ein manuelles Eingreifen (Registry-Eintragsänderung, ...).
    Von welchem Programm kommen eigentlich die pdf Ansichten von 7 oder von Acrobat ?
    Vielen Dank für eure Mühe.
    Liebe Grüsse
    Brigitte

  • Bei in InDesign erstellten Elementen mit "Scherwinkel" und dem Effekt "Abgeflachte Kante und Relief" wird beim Export als "Pdf mit Transparenzen" (Acrobat 1.6) der Effekt nicht dargestellt. Bei Pdf ohne Transparenz (Acrobat 1.3) funktioniert der Effekt.

    bei in InDesign erstellten Elementen mit "Scherwinkel" und dem Effekt "Abgeflachte Kante und Relief" wird beim Export als "Pdf mit Transparenzen" (Acrobat 1.6) der Effekt nicht dargestellt. Bei Pdf ohne Transparenz (Acrobat 1.3) funktioniert der Effekt. Gibt es eine Lösung, die das Problem behebt?Deutsche Foren

    Mit welchem Programm betrachtest Du die PDFs? Nur mit Acrobat können sie zuverlässig dargestellt werden.
    Die PDF-Versionen heißen PDF1.3 oder 1.6 und nicht Acrobat 1.3 oder 1.6, Acrobat ist das Programm, PDF das Dateiformat.
    NEIN, das ganze in Photoshop zu rastern ist keine taugliche Lösung, Du musst nur das richtige Betrachtungsprogramm wählen. Etwa Apple Vorschau ist untauglich, PDFs korrekt darzustellen.

  • Acrobat X  Pro - Problem mit dem PDF-Add-On im IE8

    Ich habe Acrobat X Pro (deutsche  Version)auf meinem Rechner (Win 7 Ultimate x64) installiert. Wenn ich  als Admin-User angemeldet bin, erscheint das Adobe-PDF Add-On im  Internet Explorer 8 in deutscher Sprache. So sollte es ja auch für die  Standard-User eigentlich sein. Aber, wenn ich mich als Standard-User  anmelde, erscheint das PDF Add-On in englischer Sprache. Wie kann das  sein?
    Wie läßt sich das ändern? Dieses Problem habe ich mit der Adobe Acrobat Pro Version 9 nicht gehabt.
    Für  Tipps wäre ich dankbar. Ich habe schon eine Fehlermeldung im  Support-Bereich aufgemacht. Bisweilen aber noch keine Antwort/Lösung  erhalten.
    Danke im Voraus.
    Jürgen

    Hallo Hans,
    ich verwende das 32-bit Add-On von Adobe Acrobat X Pro. Das Nitro PDF tool verwende ich nicht. Anbei ein Screenshot.
    Gruß
    Jürgen

  • Does Acrobat Pro read the content in pdf file and transforms it?

    Does Acrobat Pro read the content in pdf file and transforms it to xls file without the need for much changes or manual work?

    Acrobat X (Standard and Pro) will save tabular data to XLS or XLSX format, provided it can recognize the table as being a table. If the PDF has missing or incorrect structure tags, Acrobat will try to guess the table layout by the position of text and lines on the page - this works well for basic formatting but if the table has complex styling, spanned cells etc. it can lead to problems.
    Acrobat X will even attempt to export a table within a scanned document, by applying OCR during the export stage - though again this relies on the table being visually identified.
    See http://www.adobe.com/products/acrobatpro/pdf-to-word-excel-converter.html and this article on how to extract one table from a larger document.

  • How to OCR the PDF?

    Hi,
    using LiveCycle service how to ocr the PDF??.. Please give the link to do OCR the PDF using Livecycle. The programming language is asp.net & C#.
    Regards,
    R.Balajiprasad

    To clarify a bit they need to have Adobe Acrobat, not Adobe Reader. Reader has not been associated with the Acrobat name for 3 or more versions. The process you are asking about is a creation process - the purpose of Acrobat - and NOT a reading feature.

  • Wie kann ich die PDF als Duplex Druck vorgabe speichern ?

    Wie kann ich die PDF als Duplex Druck vorgabe speichern ?

    http://help.adobe.com/en_US/acrobat/X/pro/using/WS58a04a822e3e50102bd615109794195ff-7be0.w .html#WS33B0E052-3F72-41f0-9EE8-80DCA439EA1F.w

  • Online text editieren und als pdf ausgeben

    hallo,
    suche infos über die möglichkeit via browser texte zu editieren und das ganze als pdf-dokument auszugeben. wer hat tipps?
    danke euch

    Das geht zum Beispiel mit Perl:
    http://www.sanface.com/txt2pdf.html
    Die Online-Demo ist hier zu sehen:
    http://www.sanface.com/createpdf.html
    Die Suche nach Perl-Modulen für PDF bei CPAN ergibt auch noch zahlreiche Ergebnisse:
    http://search.cpan.org/search?query=pdf&mode=module
    Grüße von Sabine

  • Probleme beim Abspeichern über "Sichern als PDF" und "Exportieren als PDF"

    Ich speichere alle Dateien meines Schriftverkehrs mit Ihrem Tagesdatum, vorweg, in der Form "JJJJ-MM-TT Dateiname.ext“ ab. Das war bisher über Drucken-> Als PDF speichern absolut ist. Jetzt haut mir das System auf diesem Weg die Bindestriche raus und will es als „JJJJMMTT Dateiname.ext“ speichern. Man muss die Bindestriche jetzt vor dem speichern manuell wieder einfügen. :-(
    Das Programm Mail lässt sich bei mir nur beenden über „alt+cmd+esc“ -> Programm sofort beenden!
    Die meisten anderen Programm laufen bisher problemlos und einige wenige konten per update zum Laufen gebracht werden.
    Time Machine will seit dem Update nicht mehr so recht: War bisher die Platte voll, wurden ältere Dateien gelöscht und entsprechend weitergesichert. Jetzt bekomme ich laufend die Meldung „Datensicherung fehlgeschlagen“ mit der Meldung, dass der Speicher voll ist, also löscht Time Machine ältere Daten anscheinend nicht mehr. Ich finde aber auch keine Einstellung dazu.
    Noch schlimmer wurde das nach dem letzten Update: Will man nämlich z.B. seine E-Mail-Dateien auf diesem Wege abspeichern, wird der Betreff nicht mehr automatisch übernommen, es steht dann in der Zeile "Untitled.pdf" , das heist dann: Die Betreffzeile erst markieren, kopieren und beim Abspeichern einsetzen.
    Ziemlicher Blödsinn! :-(

    Du gehst ja mit Informationen sparsam um.
    Hast Du EPS verwendet? Die können Probleme machen und sollen schon lange nicht mehr verwendet werden. Man soll ja auch AI, PDF und PSD verwenden.
    Was beinhaltet das Dokument?
    Welche Art von Transparenzen?
    Kannst Du einzelne Seiten exportieren?
    Bleibt es bei einer bestimmten Seite hängen?
    Was ist auf dieser Seite?
    Hast Du interaktive Elemente im Dokument?
    In welchem Farbraum sind die verwendeten Bilder? RGB (am besten), CMYK oder Lab?
    Hast Du die Datei einmal nach IDML exportiert und das IDML geöffnet und neu gesichert?
    Hast Du genügend Arbeitsspeicher?
    Wieviel Festspeicher hast Du? Ist genügend frei?
    Arbeitest Du lokal? Oder über ein Netzwerk?
    Welches OS?
    Hast Du schon mal versucht die Datei zu verpacken und das verpackte Dokument zu exportieren?
    Funktionieren andere Varianten des PDF-Exports?
    Weshalb wählst Du X3? Diese Variante ist eigentlich die letzte, die man verwenden soll, auch dann wenn die Druckereien es so wollen, dann ist immer noch ein X1a besser und kompatibel. (X3 erlaubt RGB X1a ist vollkommen kompatibel zu X3 aber erlaubt nur CMYK, bei X3 kann es in einzelnen Fällen zu unterschiedlichen aber dennoch formal korrekten Ausgabeergebnissen kommen.)

  • Erstellte Berechnungen in Acrobat X funktionieren nicht in gespeicherter pdf-Datei!

    Hallo an Alle!
    Ich verwende Acrobat X Pro auf meinem Mac.
    Habe folgendes Problem:
    - über OpenOffice/Excel Formular erstellt und als pdf gespeichert
    - dieses pdf über Acrobat X geöffnet und dort Berechnungen (Summenberechnung) angelegt (über Eigenschaften-Berechnungen ...)
    - klicke ich auf "Vorschau" kann ich die angelegten Berechnungen prüfen und es klappt auch alles
    - ich beende "Vorschau" indem ich auf "Bearbeiten" klicke und klicke auf "Formularbearbeitung schließen" = kann die angelegten Berechnungen immer noch prüfen und es klappt auch alles
    - gehe auf "Datei - speichern", schließe Acrobat, öffne die pdf-Datei normal mit Doppelklick über den Reader: Berechnungen gehen nicht (mehr)
    Woran liegt das?
    Danke vorab für Hilfe!
    LG
    Erwin

    Nochmals "Hallo an Alle!"
    Habe eben die Lösung entdeckt:
    - beim Öffnen via Doppelklick verwendet Mac für pdf-Dateien standardmässig die Vorschau.app = da können angelegte Berechnungen nicht funktionieren! ;-)
    - beim Öffnen mit dem Reader geht alles tadellos!
    Vielleicht ist das Wissen um diese "Lösung" für den einen oder anderen auch von Nutzen.
    LG
    Erwin

  • Hi. I use Adobe Acrobat XI pro to make a PDF ebook embedded with audio. It works really well on my computer-I can read the book and hear the auto play mp3. The problem is, when I send it to my customers, they have difficulty hearing the audio. A few of th

    Hi. I use Adobe Acrobat XI pro to make a PDF ebook embedded with audio. It works really well on my computer-I can read the book and hear the auto play mp3. The problem is, when I send it to my customers, they have difficulty hearing the audio. A few of them say they have Flash player on their PC and somehow they still can't hear, some say their Google Chrome browser tells them they've already got one flash player while they try to download one. For me, I had to download two versions of Flash player to be able to access to the audio. I don't know what the problem is, is it because it's the latest version of Adobe Acrobat XI pro that people with older version of Adobe reader or flash player can't open it properly? Or is it something else? How can I make sure every customer with different system can access to my books? Hope to hear from you ASAP! Thank you very much.

    And how are the customers accessing the PDFs?
    What devices are they using?
    What program or apps with versions are they using?
    I this age of other then PDF eBooks formats and reader program and apss for computers and mobile devices for these formats I would look at creating the books in one or more of the eBook formats.
    Google Chrome and FireFox both have their own version of a PDF reader plug-in and they are well known to be less capable than Adobe Reader. It is possible to configure these products to use Adobe Reader.

  • Acrobat 9.0 Standard. Setting PDF file password from Excel VBA

    Acrobat 9.0 Standard. Setting PDF file password from Excel VBA
    Hi: I am trying to find a call to set the password of a PDF file that I am creating from Excel Workbook using a VBA call.
    I basically have this Excel VBA code that works fine and creates a file.
                pBook.PrintOut Copies:=1, preview:=False, ActivePrinter:="Adobe PDF", _
                               PrintToFile:=True, collate:=True, PrToFileName:=PSFileName
                ' Convert the postscript file to .pdf
                Dim myPDF As PdfDistiller
                Set myPDF = New PdfDistiller     
                myPDF.FileToPDF PSFileName, "", ""
    BUT, I need to set the password on this PDF file and do not see an option to do so.
    Can you provide a solution for this situation? Appreciate your response in advance.
    Thanks.

    There is no way to set password programmatically using any other dll or any other kit?
    I am creating a bunch of PDF files for users programmatically but then they have to go in and set password themselves? This is very inconvenient for users.

  • Acrobat 9 Pro Extended - Print to PDF setup on Windows 7 64bit???

    Hello,
    I recently purchased a high-end laptop, running Windows 7 64-bit OS. I've installed my Adobe Acrobat 9 Pro Extended software but it will not be recognized as a print option under the printers setting. Is there an update to Acrobat 9 Pro Extended, which fixes this problem? What can be done to have Acrobat show up as a print option? I bought the top of the line Acrobat so that I could MAKE PDF's. This program is completely useless to me if I cannot make PDF's with it!!!
    ANY help will be greatly appreciated!!!!!!!
    RBest-2010
    [email address deleted by host]

    Which version. I think it is a minimum of AA9.2 that is needed for X64. Anyway, you should probably either open Acrobat and do the update (help menu) or download all of the updates from Adobe>downloads>updates and install them in order. The current version is AA9.3.4.

Maybe you are looking for

  • Dynamic SQL and Oracle stored procedures

    Does anybody has any experience with invoking an Oracle stored procedures with output parameters, using dynamic SQL from Forte? Thanks, Dimitar

  • My songs show up in the iTunes library but not on my iPod

    I had my songs on my iPod Touch 3rd Generation for and I plugged it in over night. The next day I went to my music on my iPod and it said "No content available. Download songs from iTunes" I went to iTunes on my Dell computer and they are all there.

  • Boosting audio tracks in imovie6

    i have a project (due on monday!) which i cut in imovie6 all is going well. the client approved the ruff cut on friday. during playback on their projection system i did notice that some of the audio levels need to be boosted. the problem is according

  • Signed applets and dialogs

    hi all, question to clarify my understanding of signed applets. got a bog-standard applet. nothing clever or special. got myself a bog-standard cert from thawte. signed the applet and put it on a webserver. displays the correct security notice on fir

  • CMS report service not installed during installation of BOE XI 3.1 SP3

    Hi, Our current deployment is Windows 2008 64 bit / MySQL. During the installation, I got the error "The Central Management Server has failed to start. Press 'Retry' to attempt to start it again or 'Cancel' to skip any actions dependent on the Centra