OCR – תוכנות לזיהוי טקסט בעברית

 

כשסורקים מסמכים לצורך שילובם במערכת ארכיון דיגיטלי, מקבלים קבצי תמונה במספר פורמטים נפוצים ( JPG,TIF, PDF, GIF). לא ניכנס להסברים מקצועיים המפרטים את היתרונות והחסרונות של כל פורמט. הנקודה החשובה היא שלא תמיד ניתן לבצע שינויים בטקסט שבקובץ וגם לא ניתן לבצע עריכה טקסטואלית.

מצד שני, כשיוצרים מסמך וורד, ניתן למחוק, להוסיף, לשנות ולערוך כל פרט במסמך. השאיפה שלנו בהליך סריקת מסמכים היא לקבל קבצים הניתנים לזיהוי לפי שמם ולפי תוכנם. לא די בכך שנוכל לזהות אותם, לעיתים יש צורך לבצע בהם עריכה.

איך מוצאים מחט בערמת שחת?

בשונה ממסמך שנוצר במעבד תמלילים, הפורמט בו שמור המסמך הסרוק אינו מאפשר עריכה. כדי לערוך את הקובץ יש להעביר אותו הליך זיהוי באמצעות תוכנת זיהוי טקסט מתאימה אשר תמיר אותו לפורמט בר עריכה (וורד למשל) שיאפשר לבצע בו את השינויים הדרושים.

ניהול יעיל של המידע בארגון חוסך זמן וכסף. באמצעות סריקת מסמכים לפורמט דיגיטלי סורקים את כל המסמכים של הארגון (בין אם בעבודת סריקה פנים ארגונית או באמצעות חברת סריקה שמספקת שירותי סריקה). ארגונים שאינם מעוניינים להוציא מידע מחוץ לארגון בגלל אבטחת מיד הנעשים בתוך הארגון.
חשבו כמה זמן צריך להשקיע בשינויים שרוצים לעשות במסמך ישן.

לצורך ההמחשה נדמיין שיש לנו חוזה המכיל 300 עמודים אך אין לנו את קובץ המקור (או שהקובץ הודפס לפני שנים רבות במכונת כתיבה) ואנחנו רוצים לשנות בחוזה מספר נתונים. מה עושים? האם נקליד את כמות הדפים הזו ונבזבז מספר ימי עבודה לשם כך? ומה אם יש לנו מספר חוזים כאלה מידי שבוע? 

איך מבצעים שינויים במסמכים סרוקים? הפתרון פשוט. סריקת מסמכים ושמירתם בארכיון דיגיטלי. זה לא לוקסוס אלא צורך לכל ארגון, ובמיוחד לארגונים גדולים המעוניינים לחסוך זמן וכסף. סריקת מסמכים לפורמט דיגיטלי מאפשרת שליפה מהירה מסמכים, אפשרות לבצע עריכה במסמכים, חסכון בשטחי אכסון יקרים, אבטחה טובה יותר ועוד.


OCR, רבותיי, OCR


אם כן כיצד עושים זאת? לאחר סריקת המסמכים אנחנו ממירים אותם לקבצים ברי עריכה באמצעות תוכנת OCR. תוכנת OCR בעברית ממירה את המסמך הסרוק למסמך רגיל שניתן לערוך באמצעות מעבד תמלילים מכל סוג. כל עסק או ארגון יכול לחסוך זמן וכסף באמצעות שירותי OCR. ארגון המחזיק הררי מסמכים יכול בהליך די זול לייצר מהם קבצים דיגיטליים ברי עריכה. בעזרת

שירותי OCR מאפשרים להמיר את המסמכים הסרוקים לקבצים ברי לעריכה במעבד תמלילים.
כדי שהתוצאה שתקבלו באמצעות שירותי OCR תהיה איכותית יש צורך בשילוב של מספר גורמים: ביצוע סריקה באמצעות כלים מקצועיים (סורק איכותי עם תכונות מתקדמות לטיפול במסמך תוך כדי סריקה, תוכנת סריקה משובחת), שימוש בתוכנת OCR איכותית בעלת אחוזי זיהוי גבוהים (למעלה מ- 97%), רזולוציית סריקה גבוהה (לפחות 300 dpi). את הקבצים חשוב לשלב במערכת ארכיון דיגיטלי ולגבות בגיבוי רב שכבתי.

זקוק מיידית להצעת מחיר מסקאנבוק?

חייג עכשיו 054-588-0060 

Comments are closed.