-
Notifications
You must be signed in to change notification settings - Fork 9.6k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Highlighted text is not extracted #2207
Comments
Warning: Invalid resolution 0 dpi. Using 70 instead. .1 .2 תקופת ההתקשרות עם נותן השירותים תחל ביום 1 בינואר 2019 ותימשך 12 חודשים (להלן: המזמין יהיה רשאי להאריך את ההתקשרות, לארבע (4) תקופות נוספות של 12 חודשים כל
המכרז הינו מכרז פומבי, והוא ינוהל בהתאם לחוק חובת מכרזים, תשייע-2010 ולתקנות חובת המזמין. 7 טבלת מועדי המכרו .1 .32 סיור מציעים יתקיים ביום ראשון יייט במרחשון תשע"ט, ההשתתפות בסיור היא תנאי סף שאלות הבהרה עד ליום שני כ'יז במרחשוון תשע'""ט, 5 בנובמבר 2018 עד מועד אחרון להגשת הצעות למכרז | עד ליום שני ייא בכבסלו תשע'יט, 19 בנובמבר 2018 עד תאריך תוקף ערבות ההצעה עד ליום ייד באדר א' תשע'""ט, 19 בפברואר 2019 8 באוקטובר 2018 בשעה 15:00 בקמפוס המזמין ברח השעה 16:00. השעה 16:00. במקרה של סתירה בין התאריכים המופיעים בסעיף זה לבין תאריכים אחרים המופיעים המזמין שומר לעצמו את הזכות לדחות את המועדים שלעיל לפי שיקול דעתו, ובכלל זה לדחות 8 תנאי סף רשאי להגיש הצעה מציע שימלא אחר כל תנאי הסף שלהלן, באופן מצטבר: חתימה + חותמת: |
Environment
Tesseract Version:
tesseract 4.0.0-245-g7ddc
leptonica-1.74.1
libgif 5.1.4 : libjpeg 6b (libjpeg-turbo 1.5.1) : libpng 1.6.28 : libtiff 4.0.8 : zlib 1.2.8 : libwebp 0.5.2 : libopenjp2 2.1.2
Found AVX2
Found AVX
Found SSE
Platform:
Tried on both of these environments:
Linux instance-2 4.9.0-8-amd64 #1 SMP Debian 4.9.130-2 (2018-10-27) x86_64 GNU/Linux
Darwin h-MBP-sl-mwrn 16.5.0 Darwin Kernel Version 16.5.0: Fri Mar 3 16:52:33 PST 2017; root:xnu-3789.51.2~3/RELEASE_X86_64 x86_64
Current Behavior:
Dark text is not extracted when it has light yellow background color.
When converting the image to black-and-white, text is extracted successfully but quality of image decreases, which in turn causes a low quality text extraction.
Images are attached:
BlackAndWhite.jpeg
HighlightedText.jpeg
Expected Behavior:
I expect following text, for example, to be present in the extracted text:
The text was updated successfully, but these errors were encountered: