Docx: Bilder aus Word-Dokumenten extrahieren
Wenn man regelmäßig InDesign-Blogs liest und in Fachforen unterwegs ist, begegnen einem fast tagtäglich sehr wertvolle Tipps. So wie gerade eben. Diesen hier finde ich persönlich so einfach und gleichzeitig so cool, dass ich ihn hier mal posten muß :)
Wir alle kennen das: Für unser Layout bekommen wir vom Kunden Word-Dokumente geliefert. Sehr oft gibt es keinen extra Ordner mit den dazu gehörigen Bildern wie wir es bräuchten um diese in InDesign platzieren zu können. Nun, seit es das Docx-Format gibt es hier einen coolen Trick um an die Bilder zu kommen. Das X im Namen steht für XML. Seit der Windows-Version 2007 bzw. der Macintosh-Version 2008 werden Dokumente im Format »Office Open XML« abgespeichert. Nun stellt XML ja immer eine Struktur da. Solche Formate die auf XML basieren gibt es mehrere im Publishing-Bereich, z.B. IDML (InDesign Markup Language) oder auch ePub (das eBook Format das InDesign auch exportieren kann). Allen ist gemeinsam, dass man diese interne Struktur einsehen kann. Wie geht das?
Zuerst müssen wir die Endung von docx zu zip abändern:
Wir müssen dann die Meldung bestätigen und erhalten eine ZIP-Datei.
Diese ZIP-Datei lässt sich nun wie jede komprimierte Datei mit einem entsprechenden Tool entpacken, z.B. Stuffit Expander oder auch mit dem OSX-internen »Archive Utility« (früher: BOM Archive Helper«)
Wir erhalten einen Ordner mit allen zugehörigen Dateien. Im Ordner »Media« liegen alle unsere Bilder in Original Auflösung:
Man kann das Ganze auch schneller haben, z.B. mit einem entsprechenden AppleScript, dieses Skript von Shane Stanley wurde hier auf InDesignSecrets präsentiert.
Der „Ziptrick“ geht natürlich analog auch mit Powerpoint und Excell…
Trotzdem ist dies immer nur die 2-beste Methode um Bilddaten auszugliedern, da die Nutzer Bilder eventuell „optimiert :-)“ haben.
Es freut mich, dass ich nicht alleine auf dieser Welt bin! ;-)
Hallo Viola,
Danke für deinen Kommentar. Stimmt. Ich hätte das vielleicht im Artikel erwähnen sollen. Der Umweg via HTML ist sehr gut dazu geeignet. Außerdem kann das »Speichern unter« als HTML auch wie das InDesign Interchange (Austauschformat) dazu dienen, die Datei zu »säubern« und als Waschgang für schwierige Dateien zu nutzen. Das erste mal habe ich 2007 davon gehört und wir hatten das hier im Forum diskutiert:
http://www.hilfdirselbst.ch/gforum/gforum.cgi?post=313072#313072
Gruß,
Sacha
das geht in älteren word-versionen aber auch schon, über „speichern als html-datei“. dann wird zur html-datei ein ordner abgelegt, in dem u.a. die eingebettenen grafiken gespeichert werden, ggf. in zwei versionen: niedrige word-auflösung und hohe original-auflösung.
Hey Yves, ok, däi Kommentar ass dat wat ech liese wollt. Ech hu scho laang gesicht nom bescht méigleche Word-to-PDF-Converter. Wat’s du do sees kléngt wierklech gutt. A vue dass e gratis ass, ass en duerchaus eng Empfehlung. Ech wäert en dann awer mol eng Kéier testen an an e klenge Leitfaden abauen deen een engem ka schécke wann een am Fall ass.
Stëmmt: Word-Docs 1:1 fir den Drock virzebreede war ëmmer eng knëscheleg Aarbecht (déi mir awer Spaass gemaach huet ;) Souwisou béien ech duerno ëmmer alles mat de Callas Tools zurecht, sou oder sou :)
Et ass wirklech esou daat den gDoc Creator nett fir an e Workflow mat Faarwmanagement geduecht ass. Sprech fir PDFen aus der Creative Suite oder mat dem XPress.
Awer dofir ass en och schliesslech nett entwëckelt ginn. Den Schweierpunkt leit beim Office. An do ass den gDoc nun emol em villes besser als séng Konkurenz, wei z.B. dem Distiller. A well Word, Powerpoint oder Excel souwisou ken Colormanagement huet ass et egal.
Konverteirung vum XPS hun ech bis elo mat dem gDoc (Fusion) emmer direkt gemeet. Den Wee iwwert den Explorer hun ech nett ausprobéiert.
Secher ass daat een den PDF dann nach muss noverschaffen.
Allerdengs ass den XPS fir eppes super gudd. An zwar wanns du en Word fichier hues den esou soll gedréckt ginn wei den Client en firbereed huet. Mir kennen nun emol alleguer Problématique e Word Fichier op engem anneren Computer als dem Original opzemachen.
Wann ech awer elo nett Riskeieren well datt eppes am Dokument verspréngt, an den Client och nett vill Ahnung hued, roden ech em e XPS ofzespeicheren oder awer den gDoc ze installeiren an de PDF aus dem Office domat ze machen.
Resultat ass dat ech weineger Kappwei muss befärten an den Client säin Kapp och kann an Rouh leeen.
Hunn den gDoc Creator nach net ausprobéiert. Eigentlech well hei de Rohrfrei eng Warnung ausgeschwat hat:
http://www.hilfdirselbst.ch/gforum/gforum.cgi?post=426190#426190
Kann awer sinn dass de PDF usech tipp topp ass ausser eben d’Faarwkonvertéirung …
Hues du schonn eng Kéier probéiert en XPS am Internet Explorer opzemaachen an da vun do aus an den Distiller ze drécken? Dat ass de Wee dee mir bis elo als beschte bekannt war. Wann den Distiller natierlech net drop ass, kann den gDoc Creator schonn eng Alternativ sinn. Et gi jo vill anerer, hunn och mol pdf995 ausprobéiert (OpenSource) mee dat ass alles iergendwéi näischt fir den Drock-Beräich. Do kënnt den gDoc bestëmmt éischter drun.
En puer XPSen haat ech schon, obwuel een awer wirklech mierkt daat et keen Unklang bei den Leit fond huet. Zoudem, hun ech den XPS geholl an zou engen PDF konvertéiert. Daat bréngt den wéineschsten Misère.
Iwregens kann ech do den gDoc Creator vun GlobalGraphics empfehlen (http://www.globalgraphics.com/de/gdoc/creator). Leider nemmen fir PC awer dofir gratis.
Grousse firdeel bei dem Programm. Global Graphics ass dei Firma dei och den PDF Engine vum OneVision Asura mattentweckelt hun. A genau den Engine stecht och am PDF Creator. PDF dei domat aus dem MS Office erstallt ginn, sinn ganz gudd.
Matt den Schrëften hun se sech aus den Lizenzgrënn eng anfallen geloos. Dei ginn emkonverteiert/verschlesselt (Den Format wees ech elo nett auswenneg).
Et gett awer och do an der grousser Welt vum Internet Mëttel a Weer fir dat ze emgoen.
Hehe, de 17.5.? Jo wier dat e bëssen éischter komm ;) Sou geet et heiansdo. XPS hunn ech bis elo nach kee kritt. Schéngt net sou onbedingt bei de Leit duerch ze kommen dass et sou eppes gëtt … Stëmmt, ass jo och XML-baséiert. Interessant! Sinn d’Schrëften dann do och an engem Dossier ze fannen? Dat wier jo éischter net esou gutt punkto Lizenzen …
Ech hun den Trick mat der ZIP Datei bis elo och nemmen mat dem XPS Format kannt.
Ech war bis elo och een vun denen dei aus dem Word-Fichier fir d’éischt en HQ PDF gemeet hun an dann matt edit/images, Bild extraheiert.
Daat do vereinfacht d’Saach natierlech wesentlech. Blöd nemmen, daat ech den 17.05 nach Biller aus za. 30 Worddateien hun misten huelen.
Jop ass scho cool, war guer net op déi Idee komm fir esou d’Biller huelen ze goen. Usech kann een dat jo bei all Format maache wat op XML baséiert. ePub ass z.B. och sou e Fall. An et erspuert ee sech den Trick vu soss, fir en HTML ofzesaven an dann do op de Billerdossier zréck ze gräifen oder aner méi komplizéiert Weeër woubäi, een net sécher ass déi wierklech original Opléisung ze hunn … :)
Ech hat daat ganzt schon bei indesignsecrets ungekuckt an den AppleScript ass schon direkt an méng Favoriten iwwerhol ginn.