-
Notifications
You must be signed in to change notification settings - Fork 7
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Add files for Amiri - replace layer testing - decorative
- Loading branch information
1 parent
5ca3e32
commit 54b3598
Showing
9 changed files
with
339 additions
and
1 deletion.
There are no files selected for viewing
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,26 @@ | ||
الجفا . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ٨٧٢ | ||
غرام قَميت . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. ٨٧٢٣ | ||
الفؤاد الكسير . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ٨٧٤ | ||
عقيق في قيقى في عقيقي ...... .. .. ٨٧٥ | ||
الباب الحادي عشر : متفزقفات . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. ٨٧٧ | ||
التاي . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. ٨٧٩ | ||
قبيح الشاي .... ...... . .. .. ٨٨٠ | ||
مشك الشاي . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ٨٨١ | ||
ليلة الشاي . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ٨٨٢ | ||
رجال السر . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ٨٨٣ | ||
في فصل الاجتماع ه...... . . . . . . . . . . . . . . . . . . . . . . . . . . . ٨٨٤ | ||
شحجة . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ٨٨٥ | ||
لل ؤ يي ززاخة ...... . . .. ٨٨٦ | ||
خطة عبسية . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ٨٨٧ | ||
مزايا الزمان . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ٨٨٨ | ||
عضاء . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ٨٨٩ | ||
قطع علاقة في عتاب . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. ٨٩١ | ||
معاتبة . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ٨٩٢ | ||
السمكة . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ٨٩٤ | ||
نظرة . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ٨٩٥ | ||
القطار . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ٨٩٦ | ||
المقالي . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ٨٩٨ | ||
المصادر والمراجع . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. ٩٠٠ | ||
الفهرس . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ٩٠٢ | ||
٩١٢ | ||
|
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,21 @@ | ||
كلمة المنرجم | ||
|
||
تقديم الكتاب | ||
الباب الأول. التحليل التوافقي 1 | ||
1 مقتمة . . . . . . . . . . . . . . . . . ... 1 | ||
2 للبدًالأساسي للعد . . . . . . . . . . . . . . . . . . . . . . 2 | ||
3 لتبديل ...... . 4٩ | ||
. لتوافيق ...... .. 6 | ||
5 معاملات كثيرات الخدود ...... .. 11 | ||
"6 عدد الحلول الصحيحة للمعادلات . . . . . . . . . . . . . . . . . 15 | ||
ملخص الفصل ... . . . . . 19 | ||
مساثل . . . . . . . . . . . . . . . . . . . . . . . . . . 19 | ||
تمارين نظرية ... . . . . . . . . 23 | ||
اختبارات ذاتية في المسائل والتمارين . . . . . . . . . . . . . . . . 26٥ | ||
الباب الثاني. مستقمات الاحتمالات 29 | ||
21 مقتمة . . . . . . . . . . . . . . . . . . . . 29 | ||
2. فائغ العينة و الحوادث . . . . . . . . . . . . . . . . . 29 | ||
3. مسلمات الاحتمالات . . . . . . . . . . . . . . . . . . . . . 35 | ||
4. بعض المبرهنات البسيطة ...... . .. 38 | ||
5 فراغات العينة بنتانج متكافة الفرص . . . . . . . . . . . . . . . . 44 | ||
|
Binary file not shown.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,18 @@ | ||
عليه السلام ﷺ (صلى الله عليه وعلى آله وسلم) | ||
عليه السلام - صلى الله عليه وسلم ٢٧ ١ صلى الله عليه وآله - سلام الله علیها - ﷺ؛ | ||
عز فحكم وغفر فرحم ﴿ 33 ﴾ | صحيفة الدعوة الإسلامية | ||
﴿ وَيَسِّرْ لِي أَمْرِي ﴾ | ||
وأبوس]؛ ر فعلت - الترجمة إلى الفرنسية - أمثلة العربية | ||
مذكرات طالب ؛ بقلمك أنت ٠١٦١٣٠ الا هو عن | ||
؍١٩٩١؍ د اميرمي | ||
شو ناطرة ؟ | ||
مشروع الموسوعة الحرة التي يستطيع الجميع تحريرها. توجد الآن 674٬154 مقالة بالعربية. | ||
ويكيبيديا . . . . . . . . . . . ١٧٩ | ||
2014، وبرغم كونها مِن الحواضر التي أسست فِي القرن العشرين، إلا | ||
تصفح بدون إنترنت ...................................... ٦٩٨ | ||
رحم الله امرأً، قال خيراً فغنم، أو سكت فسلم. | ||
أحب السفر كل صيف، ولكن هذا العام لن ٦٩٨ أسافر بسبب انشغالي بالدراسة. | ||
٦٩٨ أين المدير؟ المدير في المكتب. | ||
قال المدير: “عندنا ١٩٩١ اجتماع بعد قليل.” اين كابوتك، يا ساميرة؟ | ||
( يوسف؛ ١٠٥٨٠ ) | ||
ﷺ |
Binary file not shown.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,31 @@ | ||
عليه السلام ل (صلى الله عليه وعلى آله وسلم) | ||
|
||
عليه السلام - صلى الله عليه وسلم ١ ٧ صلى الله عليه وآله - سلام الله عليها - ﷺ | ||
عز فحكم وغفر فرحم ﴿ 33 ﴾ | صحيفة الدعوة الإسلامية | ||
|
||
﴿ بز ي أمري ﴾ | ||
|
||
وأبوس]؛ ر فعلت - الترجمة إلى الفرنسية - أمثلة العربية | ||
|
||
منكرات طالب ؛ بقلمك أنت ٠١٦١٣٠ الا هو عن | ||
|
||
؍٩٩١؍ د اميرمي | ||
|
||
شو ناطرة ؟ | ||
|
||
مشروع الموسوعة الحرة التي يستطيع الجميع تحريرها. توجد الآن 674،154 مقالة بالعربية. | ||
ويكيبيديا . . . . . . . . . . . ١٧٩ | ||
|
||
4 وبرغم كونها من الحواضر التي أسست في القرن العشرين، إلا | ||
|
||
تصفح بدون إنترنت ...................................... ٦٩٨ | ||
|
||
رحم الله امراً، قال خيراً ففنم، أو سكت فسلم. | ||
|
||
أحب السفر كل صيف، ولكن هذا العام لن ٦٩٨ أسافر بسبب انشغالي بالدراسة. | ||
٩٨ أين المدير؟ المدير في المكتب٠ | ||
|
||
قال المدير: ‘“ عندنا ١٩٩١ اجتماع بعد قليل." اين كابوتك، يا ساميرة؟ | ||
|
||
) ١٠٥٨٠ يوسف؛ ( | ||
|
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,224 @@ | ||
#!/bin/bash | ||
# | ||
# script uses script/Arabic.traineddata to continue from and | ||
# generates ara-Amiri.traineddata using a subset of unichars from | ||
# script/Arabic and including numerals and punctuation in Arabic script | ||
################################################################ | ||
# variables to set tasks performed | ||
################################################################ | ||
MakeTest=no | ||
MakeEval=no | ||
MakeLayerMinus=no | ||
RunLayerTraining=no | ||
RunEval=yes | ||
################################################################l | ||
ModelName=ara-Amiri-layer | ||
DebugInterval=0 | ||
Lang=ara | ||
BaseLang=Arabic | ||
|
||
# tessdata directory with the 'best' traineddata | ||
bestdata_dir=~/tessdata_best/script | ||
|
||
# tessdata directory for lstm.train config files | ||
tessdata_dir=~/tessdata | ||
|
||
# directory with training scripts - tesstrain.sh etc. | ||
tesstrain_dir=~/tesseract/src/training | ||
|
||
# directory with language data - ara.config, wordlists, numbers and punc | ||
langdata_dir=~/langdata_lstm | ||
|
||
# fonts directory for this system | ||
fonts_dir=~/.fonts | ||
|
||
# fonts for minus training of best model | ||
fonts_for_minus=" \ | ||
'Amiri' \ | ||
" | ||
|
||
# fonts for computing evals of finetuned model | ||
fonts_for_eval=" \ | ||
'Amiri' \ | ||
" | ||
|
||
# output directories for this run | ||
test_output_dir=./$ModelName-test | ||
eval_output_dir=./$ModelName-eval | ||
minus_output_dir=./$ModelName-train | ||
trained_output_dir=./$ModelName-from-$BaseLang | ||
|
||
if [ $MakeTest = "yes" ]; then | ||
|
||
echo "###### MAKING TEST DATA ######" | ||
rm -rf $test_output_dir | ||
mkdir $test_output_dir | ||
|
||
eval bash $tesstrain_dir/tesstrain.sh \ | ||
--fonts_dir $fonts_dir \ | ||
--fontlist $fonts_for_eval \ | ||
--exposures "0" \ | ||
--lang $Lang \ | ||
--linedata_only \ | ||
--save_box_tiff \ | ||
--workspace_dir ~/tmp \ | ||
--noextract_font_properties \ | ||
--langdata_dir $langdata_dir \ | ||
--tessdata_dir $tessdata_dir \ | ||
--training_text ../langdata/$Lang/$Lang.new.training_text \ | ||
--output_dir $test_output_dir | ||
|
||
fi | ||
|
||
|
||
if [ $MakeEval = "yes" ]; then | ||
|
||
echo "###### MAKING EVAL DATA ######" | ||
rm -rf $eval_output_dir | ||
mkdir $eval_output_dir | ||
|
||
eval bash $tesstrain_dir/tesstrain.sh \ | ||
--fonts_dir $fonts_dir \ | ||
--fontlist $fonts_for_eval \ | ||
--exposures "0" \ | ||
--lang $Lang \ | ||
--linedata_only \ | ||
--save_box_tiff \ | ||
--workspace_dir ~/tmp \ | ||
--noextract_font_properties \ | ||
--langdata_dir $langdata_dir \ | ||
--tessdata_dir $tessdata_dir \ | ||
--training_text ../langdata/$Lang/$Lang.evaldeco.training_text \ | ||
--output_dir $eval_output_dir | ||
|
||
fi | ||
|
||
|
||
if [ $MakeLayerMinus = "yes" ]; then | ||
|
||
echo "#### This cleans out all previous checkpoints for training ####" | ||
rm -rf $trained_output_dir | ||
mkdir -p $trained_output_dir | ||
|
||
echo "###### MAKING PLUSMINUS DATA ######" | ||
rm -rf $minus_output_dir | ||
mkdir $minus_output_dir | ||
|
||
eval bash $tesstrain_dir/tesstrain.sh \ | ||
--fonts_dir $fonts_dir \ | ||
--fontlist $fonts_for_minus \ | ||
--exposures "0" \ | ||
--lang $Lang \ | ||
--linedata_only \ | ||
--save_box_tiff \ | ||
--workspace_dir ~/tmp \ | ||
--noextract_font_properties \ | ||
--langdata_dir $langdata_dir \ | ||
--tessdata_dir $tessdata_dir \ | ||
--training_text ../langdata/$Lang/$Lang.minusdeco.training_text \ | ||
--output_dir $minus_output_dir | ||
|
||
echo "#### combine_tessdata to extract lstm model from 'tessdata_best' for $BaseLang ####" | ||
combine_tessdata -u $bestdata_dir/$BaseLang.traineddata $bestdata_dir/$BaseLang. | ||
|
||
echo "#### merge unicharsets to include all required characters ####" | ||
merge_unicharsets \ | ||
../langdata/$Lang/$Lang.zwnj.unicharset \ | ||
$test_output_dir/$Lang/$Lang.unicharset \ | ||
$minus_output_dir/$Lang/$Lang.unicharset \ | ||
$eval_output_dir/$Lang/$Lang.unicharset \ | ||
$minus_output_dir/$Lang.continue.unicharset | ||
|
||
echo "#### build version string ####" | ||
Version_Str="ara:shreeshrii`date +%Y%m%d`:from:" | ||
sed -e "s/^/$Version_Str/" $bestdata_dir/$BaseLang.version > $minus_output_dir/$Lang.new.version | ||
|
||
echo "#### rebuild starter traineddata using the merged unicharset ####" | ||
combine_lang_model \ | ||
--input_unicharset $minus_output_dir/$Lang.continue.unicharset \ | ||
--script_dir $langdata_dir \ | ||
--words $langdata_dir/$Lang/$Lang.wordlist \ | ||
--numbers $langdata_dir/$Lang/$Lang.numbers \ | ||
--puncs $langdata_dir/$Lang/$Lang.punc \ | ||
--output_dir $minus_output_dir \ | ||
--lang_is_rtl \ | ||
--pass_through_recoder \ | ||
--version_str ` cat $minus_output_dir/$Lang.new.version` \ | ||
--lang $Lang | ||
|
||
cat $minus_output_dir/$Lang.training_files.txt \ | ||
$test_output_dir/$Lang.training_files.txt \ | ||
>$trained_output_dir/$Lang.training_files.txt | ||
|
||
fi | ||
|
||
if [ $RunLayerTraining = "yes" ]; then | ||
|
||
for ((LayerMinusIterations=115000; LayerMinusIterations<=200000; LayerMinusIterations+=5000)); do | ||
|
||
echo "#### Layer-Minus training Using Amiri text #####" | ||
lstmtraining \ | ||
--model_output $trained_output_dir/${ModelName} \ | ||
--continue_from $bestdata_dir/$BaseLang.lstm \ | ||
--append_index 5 --net_spec '[Lfx192 O1c1]' \ | ||
--max_iterations $LayerMinusIterations \ | ||
--debug_interval $DebugInterval \ | ||
--traineddata $minus_output_dir/$Lang/$Lang.traineddata \ | ||
--eval_listfile $eval_output_dir/$Lang.training_files.txt \ | ||
--train_listfile $trained_output_dir/$Lang.training_files.txt | ||
|
||
lstmtraining \ | ||
--stop_training \ | ||
--continue_from ${trained_output_dir}/${ModelName}_checkpoint \ | ||
--old_traineddata $bestdata_dir/$BaseLang.traineddata \ | ||
--traineddata $minus_output_dir/$Lang/$Lang.traineddata \ | ||
--model_output $trained_output_dir/$ModelName.traineddata | ||
|
||
cp $trained_output_dir/$ModelName.traineddata ../ | ||
|
||
lstmeval \ | ||
--model $trained_output_dir/$ModelName.traineddata \ | ||
--verbosity 0 \ | ||
--eval_listfile $eval_output_dir/$Lang.training_files.txt | ||
echo -e "Evaluation of $eval_output_dir was done using $ModelName.traineddata at $LayerMinusIterations iterations.\n" | ||
|
||
done | ||
|
||
fi | ||
|
||
if [ $RunEval = "yes" ]; then | ||
|
||
rm -rf ~/tesstutorial/aratest | ||
bash ~/tesseract/src/training/tesstrain.sh \ | ||
--fonts_dir ~/.fonts \ | ||
--lang ara \ | ||
--linedata_only \ | ||
--save_box_tiff \ | ||
--workspace_dir ~/tmp \ | ||
--exposures "0" \ | ||
--maxpages 1 \ | ||
--noextract_font_properties \ | ||
--langdata_dir ~/langdata_lstm \ | ||
--tessdata_dir ~/tessdata_best \ | ||
--fontlist "Amiri" \ | ||
--training_text /home/ubuntu/tessdata_arabic/langdata/ara/ara.testdeco.training_text \ | ||
--output_dir ~/tesstutorial/aratest | ||
|
||
lstmeval \ | ||
--model $trained_output_dir/$ModelName.traineddata \ | ||
--verbosity 1 \ | ||
--eval_listfile ~/tesstutorial/aratest/$Lang.training_files.txt | ||
|
||
tesseract /home/ubuntu/tesstutorial/aratest/ara.Amiri.exp0.tif ../ara.Amiri.exp0-$ModelName --tessdata-dir $trained_output_dir --oem 1 --psm 6 -l $ModelName | ||
|
||
wdiff --no-common --statistics ../ara.Amiri.exp0-$ModelName.txt /home/ubuntu/tessdata_arabic/langdata/ara/ara.testdeco.training_text | ||
|
||
cp /home/ubuntu/tesstutorial/aratest/ara.Amiri.exp0.tif ../ara.Amiri.exp0-$ModelName.tif | ||
cp /home/ubuntu/tessdata_arabic/langdata/ara/ara.testdeco.training_text ../ara.Amiri.exp0-$ModelName.testdeco.gt.txt | ||
|
||
tesseract /home/ubuntu/tessdata_arabic/Arabic-TOC.png /home/ubuntu/tessdata_arabic/Arabic-TOC-$ModelName --tessdata-dir ../ --oem 1 --psm 6 -l $ModelName | ||
|
||
tesseract /home/ubuntu/tessdata_arabic/Arabic-TOC-numbers.png /home/ubuntu/tessdata_arabic/Arabic-TOC-numbers-$ModelName --tessdata-dir ../ --oem 1 --psm 6 -l $ModelName | ||
|
||
fi | ||
|
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,18 @@ | ||
عليه السلام ﷺ (صلى الله عليه وعلى آله وسلم) | ||
عليه السلام - صلى الله عليه وسلم ٢٧ ١ صلى الله عليه وآله - سلام الله علیها - ﷺ؛ | ||
عز فحكم وغفر فرحم ﴿ 33 ﴾ | صحيفة الدعوة الإسلامية | ||
﴿ وَيَسِّرْ لِي أَمْرِي ﴾ | ||
وأبوس]؛ ر فعلت - الترجمة إلى الفرنسية - أمثلة العربية | ||
مذكرات طالب ؛ بقلمك أنت ٠١٦١٣٠ الا هو عن | ||
؍١٩٩١؍ د اميرمي | ||
شو ناطرة ؟ | ||
مشروع الموسوعة الحرة التي يستطيع الجميع تحريرها. توجد الآن 674٬154 مقالة بالعربية. | ||
ويكيبيديا . . . . . . . . . . . ١٧٩ | ||
2014، وبرغم كونها مِن الحواضر التي أسست فِي القرن العشرين، إلا | ||
تصفح بدون إنترنت ...................................... ٦٩٨ | ||
رحم الله امرأً، قال خيراً فغنم، أو سكت فسلم. | ||
أحب السفر كل صيف، ولكن هذا العام لن ٦٩٨ أسافر بسبب انشغالي بالدراسة. | ||
٦٩٨ أين المدير؟ المدير في المكتب. | ||
قال المدير: “عندنا ١٩٩١ اجتماع بعد قليل.” اين كابوتك، يا ساميرة؟ | ||
( يوسف؛ ١٠٥٨٠ ) | ||
ﷺ |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters