Hi ha una diferència de mida de fitxer substancial entre un PDF natiu i un PDF escanejat? En cas afirmatiu, quina diferència hi ha?


Resposta 1:

Sí, sol haver una diferència de mida substancial entre un PDF correctament destil·lat i un document escanejat.

Un PDF natiu s’assembla més a un fitxer de text, només emmagatzema els caràcters necessaris dels tipus de lletra i la disposició del text a cada pàgina. Com que els tipus de lletra són en format vectorial, són extremadament compactes i es poden augmentar les mides sense perdre nitidesa. Els PDF també admeten gràfics vectorials arbitraris com a il·lustracions.

Els PDF també tenen la possibilitat d’emmagatzemar imatges rasteritzades fetes de píxels exactament com una foto digital. Si teniu una pàgina de 210 mm x 297 mm a 600 dpi que equival a una resolució de 7016x4958 = 34,8 mega píxel, per a una pàgina. Ara quantes pàgines té el document de nou? Fins i tot a 300 dpi, és de 8,7 megapíxels per pàgina.

El PDF només admet uns quants algorismes de compressió d’imatges i, encara que un d’aquests és JPEG, un document escanejat no es comprimeix bé amb JPEG. Fins i tot amb la deflatació de TIFF LZW o PNGs, una imatge de 34 mpixel encara serà de mida considerable.


Resposta 2:

Hi pot haver certament i sol ser-ho.

Un PDF basat en proves natives és bàsicament molt espai blanc amb caràcters digitals que representen lletres. Aquest és un format de dades molt compacte.

Un PDF escanejat és una imatge. Cada petit detall es representa fins i tot quan la imatge està comprimida. A causa dels algorismes d'emmagatzematge, les dades d'imatges són gairebé sempre majors que el text.