Skip to content

Commit

Permalink
Add results of OCR of test image with tessdata_best and tessdata_fast)
Browse files Browse the repository at this point in the history
  • Loading branch information
Shreeshrii committed Feb 28, 2019
1 parent 6406267 commit 731b3c7
Show file tree
Hide file tree
Showing 4 changed files with 66 additions and 2 deletions.
31 changes: 31 additions & 0 deletions ara.Amiri.exp0-ara-Amiri-layer-best.txt
Original file line number Diff line number Diff line change
@@ -0,0 +1,31 @@
عليه السلام كله (صل الله عليه وعل آله وسلم)

عليه السلام - صل الله عليه وس ‎١ ٠‏ صل الله عليه وآله - سلام الله عليها - كي
عن لحك وغفر فرحم ( 33 4 | صحيفة الدعوة الإسلامية

« دبي لي أثري 4

وأبوس]؛ ر فعات - الترجمة إلى الفرنسية - أمثلة العربية

مذكرات طالب ؛ بقلمك أنت ‎١16130‏ الا هوعن

7 د اميري

شو ناطرة ؟

مشروع الموسوعة الحرة التي يستطيع الجميع تحريرها. توجد الآن 6746154 مقالة بالعربية.
ويكييديا ‎١٠٠...‏ 4لا

4. وبرغم كونها من الحواضر التي أسست في القرن العشرين» إلا

تصفح بدون إنترنت تت رقا

رحم الله امرأ؛ قال خيراً فقيء أو سكت فسلء

أحب السفر كل صيف» ولكن هذا العام لن 148 أسافر بسبب انشغالي بالدراسة.
4 أبن المدير؟ المدير في المكتب.

قال المدير: “عندنا ‎١99١‏ اجتماع بعد قليل.” ابن كابوتك» يا ساميرة؟

) ٠١٠860 ‏يوسف؛‎ (

31 changes: 31 additions & 0 deletions ara.Amiri.exp0-ara-Amiri-layer-fast.txt
Original file line number Diff line number Diff line change
@@ -0,0 +1,31 @@
عليه السلام يكل (صل الله عليه وعلى آله وسلم)

عليه السلام - صلى الله عليه وسلم /ا؟ ‎١‏ صل الله عليه وآله - سلام الله عليها - وك
عن لفكم وغفر فرحم ‏ 33 4 | صحيفة الدعوة الإسلامية

« تسن أثْري »

وأبوس]؟ ر فعلت - الترجمة إلى الفرفسية - أمثلة العربية

مذكات طالب ؛ بقليك أنت ‎٠1510‏ الا هو عن

7 دأآميري

شو ناطرة ؟

مشروع الموسوعة الحرة التي يستطيع الميع تحريرها. توجد الآن 6742154 مقالة بالعربية.
ويكييديا ...0.6.2.2 لآ

4 وبرغم كونها من الحواضر التي أسست في القرن العشرين» إلا

ا ل ل

رحم الله امرأء قال خيراً ففنم» أو سكت فسلم.

أحب السفر كل صيف» ولكن هذا العام لن 14/4 أسافر بسبب انشغالي بالدراسة.
أن المدير؟ المدير في المكتب.

قال المدير: “عندنا ‎١991١‏ اجتماع بعد قليل.” اين كابوتك» يا ساميرة؟

(يوسف؛ ٠١٠8ه١٠١)‏

Binary file modified ara.Amiri.exp0-ara-Amiri-layer.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
6 changes: 4 additions & 2 deletions build/tesstrain_layer.sh
Original file line number Diff line number Diff line change
Expand Up @@ -210,10 +210,12 @@ if [ $RunEval = "yes" ]; then
--eval_listfile ~/tesstutorial/aratest/$Lang.training_files.txt

tesseract /home/ubuntu/tesstutorial/aratest/ara.Amiri.exp0.tif ../ara.Amiri.exp0-$ModelName --tessdata-dir $trained_output_dir --oem 1 --psm 6 -l $ModelName

tesseract /home/ubuntu/tesstutorial/aratest/ara.Amiri.exp0.tif ../ara.Amiri.exp0-$ModelName-best --tessdata-dir ~/tessdata_best --oem 1 --psm 6 -l ara
tesseract /home/ubuntu/tesstutorial/aratest/ara.Amiri.exp0.tif ../ara.Amiri.exp0-$ModelName-fast --tessdata-dir ~/tessdata_fast --oem 1 --psm 6 -l ara

wdiff --no-common --statistics ../ara.Amiri.exp0-$ModelName.txt /home/ubuntu/tessdata_arabic/langdata/ara/ara.testdeco.training_text

cp /home/ubuntu/tesstutorial/aratest/ara.Amiri.exp0.tif ../ara.Amiri.exp0-$ModelName.tif
convert /home/ubuntu/tesstutorial/aratest/ara.Amiri.exp0.tif ../ara.Amiri.exp0-$ModelName.png
cp /home/ubuntu/tessdata_arabic/langdata/ara/ara.testdeco.training_text ../ara.Amiri.exp0-$ModelName.testdeco.gt.txt

tesseract /home/ubuntu/tessdata_arabic/Arabic-TOC.png /home/ubuntu/tessdata_arabic/Arabic-TOC-$ModelName --tessdata-dir ../ --oem 1 --psm 6 -l $ModelName
Expand Down

0 comments on commit 731b3c7

Please sign in to comment.