גודל קבצים סרוקים – איך מחשבים משקל צפוי של קובץ בסריקה ל- PDF בשחור לבן ובצבע?
מתכננים פרויקט סריקה ורוצים לדעת מראש מה יהיה גודל הקבצים? יש דרך לעשות זאת. המספרים אמנם אינם מוחלטים ומדויקים אבל יתנו לכם סדר גודל משוער.
משקל הקובץ תלוי בצפיפות הדיו על הדף המיועד לסריקה ובהגדרות הסריקה (רזולוציה, איכות, ש"ל, גווני אפור או צבע) המוזנות לסורק. בהנחה שהרזולוציה קבועה בשלושת מצבי הסריקה, אזי שסריקת מסמכים בצבע מלא נותנת איכות גבוהה אבל יוצרת קבצים גדולים, סריקת מסמכים בגווני אפור נותנת איכות בינונית וקבצים בגודל בינוני, וסריקת מסמכים בשחור לבן נותנת איכות בסיסית וקבצים קטנים.
סריקת מסמכים ברזולוציה של 300 DPI נותנת איכות מעולה אבל קבצים כבדים, סריקת מסמכים ב- 150 DPI נותנת איכות טובה וקבצים בינוניים, וסריקת מסמכים ב- 100 DPI נותנת איכות בסיסית אבל קבצים קטנים.
מהניסיון שלנו מומלץ לסרוק מסמכים רגילים בשחור לבן ברזולוציה של 300 DPI . זה מספיק טוב להדפסה, קל לשליחה במייל, והגודל הממוצע הוא רק כ-40 קילו-בייט לעמודPDF . אם רוצים איכות גבוהה יותר, אפשר להשתמש בגווני אפור ב-150 DPI שמתאים לסריקה טובה יותר של מסמכים, אבל כדאי לקחת בחשבון שהקבצים יהיו כבדים לשליחה במייל כי הגודל הממוצע הוא 2 מגה-בייט לעמוד PDF .
אז איך מתחילים?
ראשית מגדירים את גודל הקובץ המשוער של עמוד אחד. סריקת עמוד A4 בשחור־לבן ב‑300 DPI בדרך כלל מניבה קובץ בגודל של כ־40 KB לעמוד. אם לדוגמה אנחנו רוצים לסרוק 900 עמודי A4 נכפיל את משקלו של עמוד אחד (40KB) ב- 900 ונקבל 36 MB. אם רוצים קובץ קטן יותר יש להקטין את הרזולוציה לכיוון ה- 200 DPI ונקבל קובץ באיכות סבירה בגודל של כ- 20 MB.
ניתן להקטין עוד את גודל הקבצים אם נשתמש בהגדרה של דחיסה חכמה כמו CCITT G4 שיכולה לכווץ את הקובץ לעיתים עד 1/3–1/4 מהגודל המקורי .
ואם הסריקה תהיה ב 600 DPI?
בדרך כלל סריקה ברזולוציה של 600 DPI נעשית כשרוצים איכות גבוהה או שצריכים להשתמש בתוכנת OCR להמרת הקובץ לפורמט וורד או PDF בר חיפוש. כשמדובר בסריקת מסמכים בשחור‑לבן לצרכי OCR, גודל הקובץ תלוי בעיקר ברזולוציה ובדחיסה:
- סריקת מסמכים ב‑ 300 DPI לפורמט PDF בר־חיפוש (Searchable PDF) תייצר קובץ של כ- 40 קילו‑בייט לעמוד.
- סריקת מסמכים ב‑600 DPI לפורמטPDF בר־חיפוש תגדיל את הקובץ פי 4.
בהמשך לדוגמה הקודמת בה רצינו לדעת מה יהיה גודל הקובץ בסריקה של 900 עמודים, אזי שסריקת עמוד A4 ב‑600 DPI תייצר קובץ של כ- 144 MB. טווח זה הוא בסיס בלבד בהערכת גדלי קובץ בסריקות משרדיות או משפטיות.
להלן אומדן משקלי קובץ עבור קובצי סריקה של 900 עמודים, לפי רזולוציית הסריקה וסוג הסריקה.
סריקה בגווני אפור לפורמט PDF
בסריקה ללא דחיסה ברזולוציה של 300 DPI כל עמוד עשוי להיות כ- 0.5 MB, כך שסריקת 900 עמודים תהיה כ- 450 MB . סריקה בדחיסה יכולה להקטין את הקובץ עד פי 20. אם המסמך מכיל גרפיקה או תמונות – הגודל יעלה בהתאם.
סריקה בצבע לפורמט PDF
סריקת עמוד A4 ברזולוציה של 300 DPI מייצרת קובץ במשקל של כ- 1 MB. ככל שהדף מכיל יותר פרטים ויותר דיו הקובץ יהיה כבד יותר. סריקה של תמונה המכסה את כל הדף תיצור את הקובץ הגדול ביותר. אם נמשיך בהשוואה של סריקת 900 עמודים באיכויות שונות נקבל קובץ של 900 MB בסריקה ברזולוציה של 300 DPI.
סריקה ברזולוציה של 600 DPI מייצרת קובץ במשקל של כ- 4 MB לעמוד, כך שסריקת 900 עמודים תיצור לנו קובץ גדול במשקל כ- 3.6 GB.
מסקנות:
- סריקה בשחור־לבן קריטית לחיסכון במקום – היא מספקת קבצים קומפקטיים, והיא אידיאלית לסריקת טקסט בלבד.
- אם רוצים לעשות OCR – סריקה ב- 300 DPI בשחור לבן תייצר לנו קובץ באיכות סבירה במשקל קטן.
- סריקה ברזולוציה של 600 DPI – מומלצת לדפים עם פרטים קטנים בגווני אפור או צבע, או כשזקוקים ל OCR איכותי ומוכנים לקבל קובץ גדול.
- סריקה בצבע או בגווני אפור – תופסת נפח רב יותר ועדיין כדאי להשתמש ב- 300 DPI אם אין צורך באיכות גבוהה להדפסה.
- אם מעלים קבצים לאינטרנט / לענן או שומרים בארכיונים – עדיף סריקה בשחור-לבן (בדחיסה) ב-300 DPI . זה מייצר קובץ קטן, חוסך מקום אחסון, ניתן להעלות לאינטרנט ולשלוח במייל, וזה מספיק טוב לזיהוי טקסט והמרת קבצי PDF עם תוכנת OCR.
- לסריקת דפים עם גרפיקה, תמונות או עם פרטים עדינים – אפשר לבחור בגווני אפור ב‑300 DPI או צבע, אבל לקחת בחשבון שיתקבל קובץ בגודל בינוני.
לסריקת ספרים ומסמכים
חייגו 054-5880060
