Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Bump release #99

Merged
merged 40 commits into from
Apr 11, 2022
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
Show all changes
40 commits
Select commit Hold shift + click to select a range
631b02b
ko-chapter1/1
Apr 1, 2022
e27454b
ko _toctree.yml created
Apr 1, 2022
ea10974
Fix the issue #80
Apr 2, 2022
2653c29
Single expression changed
Apr 2, 2022
f3073c2
ko/chapter1 finished
Apr 2, 2022
278753a
ko/chapter0 finished
Apr 2, 2022
1ec6d9c
ko/chapter0 finished
Apr 2, 2022
e5285b7
reviewed by @bzantium ko/chapter0
Apr 3, 2022
95bb455
reviewed by @bzantium chapter0 & fixed typo
Apr 3, 2022
3012092
reviewed by @rainmaker712
Apr 3, 2022
d84afe9
maximize Korean expressions
Apr 3, 2022
1193811
[Chapter 1] bangla traslation initial commit
Apr 4, 2022
33e0a04
Update 1.mdx
eNipu Apr 4, 2022
fa77e72
Fix formating and typos
Apr 4, 2022
d7c9f56
Merge branch 'huggingface:main' into main
eNipu Apr 4, 2022
ef201cb
translate _toctree.yml 0-1 chapter
Apr 4, 2022
211d8c0
Merge branch 'main' into kor
lewtun Apr 4, 2022
b664828
Add Korean to CI
lewtun Apr 4, 2022
b58e7e4
[tr] Translated chapter1/2.mdx
ftarlaci Apr 4, 2022
a775ef6
Merge branch 'huggingface:main' into main
eNipu Apr 5, 2022
e82e845
remove translation from sec titles not yet translated
Apr 5, 2022
045ca30
Add authors [th ru]
lewtun Apr 5, 2022
35c9fcd
Merge pull request #94 from huggingface/add_authors_1
lewtun Apr 5, 2022
0f068d5
[FIX] _toctree.yml
Apr 5, 2022
c548c2f
Merge branch 'huggingface:main' into main
eNipu Apr 5, 2022
fd8bef7
Update chapters/bn/chapter0/1.mdx
eNipu Apr 5, 2022
07766e6
tag typos & indentation & unnatural expressions
Apr 5, 2022
3d4f9af
Merge branch 'main' into kor
wavy-jung Apr 5, 2022
9855aa9
modified toctree.yml for chapter1/2
ftarlaci Apr 5, 2022
05cb27c
modified toctree.yml for chapter1/2 & fix typo
ftarlaci Apr 5, 2022
40a3ea8
French Translation - Chapter 5
melaniedrevet Apr 6, 2022
1f89e8a
Merge pull request #80 from Doohae/kor
lewtun Apr 6, 2022
2406a54
Merge pull request #91 from ftarlaci/main
lewtun Apr 6, 2022
c4a44e4
Merge pull request #89 from eNipu/main
lewtun Apr 6, 2022
eabce90
Merge pull request #96 from melaniedrevet/main
lewtun Apr 6, 2022
74017a4
Merge branch 'main' into bump_release_2
lewtun Apr 6, 2022
0821f1f
Add Bengali to CI
lewtun Apr 11, 2022
74c9f35
Update author list
lewtun Apr 11, 2022
de55784
Merge pull request #110 from huggingface/add-bengali
lewtun Apr 11, 2022
bd8f4b4
Merge branch 'main' into bump_release_2
lewtun Apr 11, 2022
File filter

Filter by extension

Filter by extension


Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
2 changes: 1 addition & 1 deletion .github/workflows/build_documentation.yml
Original file line number Diff line number Diff line change
Expand Up @@ -14,6 +14,6 @@ jobs:
package: course
path_to_docs: course/chapters/
additional_args: --not_python_module
languages: en es fa fr he pt ru th tr
languages: bn en es fa fr he ko pt ru th tr
secrets:
token: ${{ secrets.HUGGINGFACE_PUSH }}
2 changes: 1 addition & 1 deletion .github/workflows/build_pr_documentation.yml
Original file line number Diff line number Diff line change
Expand Up @@ -16,5 +16,5 @@ jobs:
package: course
path_to_docs: course/chapters/
additional_args: --not_python_module
languages: en es fa fr he pt ru th tr
languages: bn en es fa fr he ko pt ru th tr
hub_base_path: https://moon-ci-docs.huggingface.co/course
4 changes: 3 additions & 1 deletion README.md
Original file line number Diff line number Diff line change
Expand Up @@ -7,8 +7,10 @@ This repo contains the content that's used to create the **[Hugging Face course]
| Language | Source | Authors |
|:-------------------------------------------------------|:-----------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| [English](https://huggingface.co/course/en/chapter1/1) | [`chapters/en`](https://github.com/huggingface/course/tree/main/chapters/en) | [@sgugger](https://github.com/sgugger), [@lewtun](https://github.com/lewtun), [@LysandreJik](https://github.com/LysandreJik), [@Rocketknight1](https://github.com/Rocketknight1), [@sashavor](https://github.com/sashavor), [@osanseviero](https://github.com/osanseviero), [@SaulLu](https://github.com/SaulLu), [@lvwerra](https://github.com/lvwerra) |
| [Korean](https://huggingface.co/course/ko/chapter1/1) (WIP) | [`chapters/ko`](https://github.com/huggingface/course/tree/main/chapters/ko) | [@Doohae](https://github.com/Doohae) |
| [Russian](https://huggingface.co/course/ru/chapter1/1) (WIP) | [`chapters/ru`](https://github.com/huggingface/course/tree/main/chapters/ru) | [@pdumin](https://github.com/pdumin) |
| [Spanish](https://huggingface.co/course/es/chapter1/1) (WIP) | [`chapters/es`](https://github.com/huggingface/course/tree/main/chapters/es) | [@camartinezbu](https://github.com/camartinezbu) |
| [Thai](https://huggingface.co/course/th/chapter1/1) (WIP) | [`chapters/th`](https://github.com/huggingface/course/tree/main/chapters/th) | [@peeraponw](https://github.com/peeraponw) |
| [Thai](https://huggingface.co/course/th/chapter1/1) (WIP) | [`chapters/th`](https://github.com/huggingface/course/tree/main/chapters/th) | [@peeraponw](https://github.com/peeraponw), [@a-krirk](https://github.com/a-krirk), [@jomariya23156](https://github.com/jomariya23156) |

### Translating the course into your language

Expand Down
4 changes: 4 additions & 0 deletions chapters/bn/_toctree.yml
Original file line number Diff line number Diff line change
@@ -0,0 +1,4 @@
- title: 0. সেটআপ
sections:
- local: chapter0/1
title: ভূমিকা
112 changes: 112 additions & 0 deletions chapters/bn/chapter0/1.mdx
Original file line number Diff line number Diff line change
@@ -0,0 +1,112 @@
# ভূমিকা

হাগিং ফেস কোর্সে স্বাগতম! এই অধ্যায়টি একটি "ওয়ার্কিং এনভায়রনমেন্ট" সেট আপ করতে আপনাকে গাইড করবে। আপনি যদি এইপ্রথম কোর্সটি শুরু করে থাকেন, আমরা আপনাকে প্রথমে [অধ্যায় 1](/course/chapter1) একবার দেখে পড়ে আসার পরামর্শ দিচ্ছি, ফিরে এসে "ওয়ার্কিং এনভায়রনমেন্ট" সেট আপ করুন যাতে আপনি নিজেই কোডটি চেষ্টা করতে পারেন।

এই কোর্সে আমরা যে সমস্ত লাইব্রেরিগুলি ব্যবহার করব সেগুলি পাইথন প্যাকেজ হিসাবে পাওয়া যাবে, তাই এখানে আমরা আপনাকে দেখাব কিভাবে একটি পাইথন এনভায়রনমেন্ট সেট আপ করতে হয় এবং আপনার প্রয়োজনীয় নির্দিষ্ট লাইব্রেরিগুলি ইনস্টল করতে হয়৷

Colab নোটবুক বা পাইথন virtual environment ব্যবহার করে আমরা "ওয়ার্কিং এনভায়রনমেন্ট" সেট-আপ করার দুটি উপায় কভার করব। যে পদ্ধতিটি আপনার কাছে সহজ সেটি আপনি বেছে নিতে পাড়েন। যারা নতুন শুরু করছেন তাদের জন্য আমরা Colab নোটবুক ব্যবহার করে শুরু করতে জোরালোভাবে রিকমেন্ড করি।

মনে রাখবেন যে এখানে উইন্ডোজ সিস্টেম কভার করা হবে না। আপনি যদি উইন্ডোজ চালান, তাহলে আমরা Colab নোটবুক ব্যবহার করে ফলো করার পরামর্শ দিচ্ছি। আর আপনি যদি লিনাক্স ডিস্ট্রিবিউশন বা ম্যাকওএস ব্যবহার করেন তবে এখানে বর্ণিত পদ্ধতির যেকোনো একটি ব্যবহার করতে পারেন।

কোর্সের অনেকটাই হাগিং ফেস অ্যাকাউন্ট উপর নির্ভর করবে। তাই আমরা একটি একাউন্ট ওপেন করার করার পরামর্শ দিচ্ছি: [একটি অ্যাকাউন্ট তৈরি করুন](https://huggingface.co/join)।

## Google Colab নোটবুক ব্যবহার করার পদ্ধতি

Colab নোটবুক ব্যবহার করার সবচেয়ে সহজ সেটআপ হচ্ছে ব্রাউজারে একটি নোটবুক ওপেন করুন এবং সরাসরি কোডিং এ যান!

আপনি যদি Colab-এর সাথে পরিচিত না হন তাহলে আমরা আপনাকে [Colab পরিচয়](https://colab.research.google.com/notebooks/intro.ipynb) অনুসরণ করে শুরু করার পরামর্শ দিচ্ছি। Colab আপনাকে কিছু এক্সেলারেসন হার্ডওয়্যার ব্যবহার করতে দেয়, যেমন GPUs বা TPUs যা ছোট ওয়ার্ক লোডের জন্য ফ্রি।

Colab-এর উপর আপানার হাত চলে আসলে একটি নতুন নোটবুক ওপেন করে সেট-আপ শুরু করুন:

<div class="flex justify-center">
<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/new_colab.png" alt="An empty colab notebook" width="80%"/>
</div>

পরবর্তী ধাপে আমরা এই কোর্সে ব্যবহার হবে এমন লাইব্রেরিগুলি ইনস্টল করা দেখাবো। আমরা ইনস্টলেশনের জন্য পাইথনের প্যাকেজ ম্যানেজার `pip` ব্যবহার করব। নোটবুকগুলিতে, আপনি `!` অক্ষর দিয়ে আগে সিস্টেম কমান্ড চালাতে পারবেন। যেমন ধরুন, নিচের কমান্ডটি দিয়ে 🤗 Transformers লাইব্রেরি ইনস্টল করতে পারবেন:

```
!pip install transformers
```

প্যাকেজটি আপনার পাইথন রানটাইমের মধ্যে সঠিকভাবে ইনস্টল করা হয়েছে কিনা তা import করে নিশ্চিত হতে পাড়েন।

```
import transformers
```

<div class="flex justify-center">
<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter0/install.gif" alt="একটি gif উপরের দুটি কমান্ডের ফলাফল দেখাচ্ছে: installation and import" width="80%"/>
</div>

এটি 🤗 ট্রান্সফরমারের একটি খুব লাইট ভার্সন ইনস্টল করে। বিশেষ করে, যদিনা নির্দিষ্ট মেশিন লার্নিং ফ্রেমওয়ার্ক (যেমন PyTorch বা TensorFlow) ইনস্টল করা থাকে। যেহেতু আমরা লাইব্রেরির বিভিন্ন ফিচার ব্যবহার করব, তাই আমরা ডেভেলপমেন্ট ভার্সন ইনস্টল করার পরামর্শ দিচ্ছি, যতে ধারানা করার এমন সব ইউজ কেসে কাজ করবে:

```
!pip install transformers[sentencepiece]
```

ইনস্টল হতে কিছুটা সময় লাগবে, কিন্তু এরপর আপনি বাকি কোর্সের জন্য প্রস্তুত হয়ে যাবেন!

## একটি পাইথন virtual environment ব্যবহার করা

আপনি যদি পাইথন virtual environment ব্যবহার করতে পছন্দ করেন, প্রথম ধাপ হল আপনার সিস্টেমে পাইথন ইনস্টল করা। শুরু করার জন্য আমরা [এই নির্দেশিকা](https://realpython.com/installing-python/) অনুসরণ করার পরামর্শ দিচ্ছি।

একবার আপনি পাইথন ইনস্টল করলে, আপনি আপনার টার্মিনালে পাইথন কমান্ড চালাতে সক্ষম হবেন। পরবর্তী ধাপে যাওয়ার আগে এটি সঠিকভাবে ইনস্টল করা হয়েছে তা নিশ্চিত করতে আপনি নিম্নলিখিত কমান্ডটি চালিয়ে শুরু করতে পারেন: `python --version`। এটি আপনার সিস্টেমে ইনস্টল হওয়া পাইথন সংস্করণটি প্রিন্ট করা উচিত।

আপনার টার্মিনালে পাইথন কমান্ড চালানোর সময়, যেমন `python --version`, আপানাকে ভাবতে হবে যে এটি "main" পাইথন প্রোগ্রাম যা আপানার কমান্ড টিকে রান করছে। আমরা এই মূল ইনস্টলেশনটিকে যেকোন প্যাকেজ ইনস্টল থেকে মুক্ত রাখার সুপারিশ করি। এ আপনি যখন আলাদা অ্যাপ্লিকেশনে কাজ করবেন তখন তার জন্য আলাদা virtual environment তৈরি করতে এই পাইথন ইনস্টলেশনটিকে ব্যবহার করবেন। এতে করে প্রতিটি অ্যাপ্লিকেশনের নিজস্ব ডিপেন্ডেন্সি এবং প্যাকেজ আলাদা থাকবে এবং অন্যান্য অ্যাপ্লিকেশনের সাথে এর সম্ভাব্য কম্পাটিবিলটি নিয়ে আপানকে সমস্যায় করতে হবে না।

পাইথনে এটি [*virtual environments*](https://docs.python.org/3/tutorial/venv.html) দিয়ে করা হয়, যেটি স্বয়ংসম্পূর্ণ ডিরেক্টরি ট্রি। যার প্রত্যেকটিতে এপ্লিকেশনের প্রয়োজনীয় সমস্ত প্যাকেজের পাশাপাশি একটি নির্দিষ্ট পাইথন ভার্শনের পাইথন ইনস্টলেশন আছে। এই ধরনের একটি virtual environments বিভিন্ন ভাবে তৈরি করা যেতে পারে। তবে আমরা এর জন্য অফিসিয়াল পাইথন প্যাকেজ ব্যবহার করব, যাকে বলা হয় [`venv`](https://docs.python.org/3/library) /venv.html#module-venv)।

প্রথমে, আপনি যে ডিরেক্টরিটি আপনার অ্যাপ্লিকেশনটিতে রাখতে চান তা তৈরি করুন — উদাহরণস্বরূপ, আপনি আপনার হোম ডিরেক্টরির বা ফোল্ডার ভেতর *transformers-course* নামে একটি নতুন ডিরেক্টরি তৈরি করতে চাইতে পারেন:

```
mkdir ~/transformers-course
cd ~/transformers-course
```

এই ডিরেক্টরির ভিতর থেকে, পাইথন `venv` মডিউল ব্যবহার করে একটি virtual environment তৈরি করুন:

```
python -m venv .env
```

আপনার এখন *.env* নামে একটি ফোল্ডার থাকা উচিত, অন্যথায় খালি ফোল্ডার :

```
ls -a
```

```out
. .. .env
```


আপনি এখন virtual environment টি `activate` করতে বা `deactivate` নিচের কমান্ড গুলো ব্যবহার করতে পারেন।

```
# virtual environment টি activate করার কমান্ড
source .env/bin/activate

# virtual environment টি deactivate করার কমান্ড
source .env/bin/deactivate
```

`which python` কমান্ড চালিয়ে নিশ্চিত করতে পারেন যে virtual environment টি activate হয়েছে কিনা।
যদি এটি virtual environment টি কে পয়েন্ট করে করে, তাহলে আপনি সফলভাবে এটি সক্রিয় করেছেন!

```
which python
```

```out
/home/<user>/transformers-course/.env/bin/python
```

### ডিপেন্ডেন্সি ইনস্টল করা

আগের সেকশনে Google Colab এ যেভাবে প্যাকেজ ইনস্টল করা হয়েছে একই ভাবে এখানেও `pip` প্যাকেজ ম্যানেজার ব্যবহার করে 🤗 Transformer এর development সংস্করণ ইনস্টল করতে পারেন:

````
pip install "transformers[sentencepiece]"
````

আপনি এখন শুরু করা জন্য সম্পূর্ণ প্রস্তুত!
22 changes: 21 additions & 1 deletion chapters/fr/_toctree.yml
Original file line number Diff line number Diff line change
@@ -1,4 +1,24 @@
- title: 0. Configuration
sections:
- local: chapter0/1
title: Introduction
title: Introduction

- title: 5. La bibliothèque 🤗 Datasets
sections:
- local: chapter5/1
title: Introduction
- local: chapter5/2
title: Que faire si mon ensemble de données n'est pas sur le Hub ?
- local: chapter5/3
title: Il est temps de trancher et de découper
- local: chapter5/4
title: Big Data? 🤗 Des jeux de données à la rescousse !
- local: chapter5/5
title: Création de votre propre jeu de données
- local: chapter5/6
title: Recherche sémantique avec FAISS
- local: chapter5/7
title: 🤗 Datasets, vérifié !
- local: chapter5/8
title: Quiz de fin de chapitre
quiz: 5
17 changes: 17 additions & 0 deletions chapters/fr/chapter5/1.mdx
Original file line number Diff line number Diff line change
@@ -0,0 +1,17 @@
# Introduction

Dans le [Chapitre 3](/course/chapter3) vous avez eu un premier aperçu de la bibliothèque 🤗 Datasets et vous avez vu qu'il y avait trois étapes principales pour affiner un modèle:

1. Chargez un jeu de données à partir de Hugging Face Hub.
2. Prétraitez les données avec `Dataset.map()`.
3. Charger et calculer des métriques.

Mais ce n'est qu'effleurer la surface de ce que 🤗 Datasets peut faire ! Dans ce chapitre, nous allons plonger profondément dans la bibliothèque. En cours de route, nous trouverons des réponses aux questions suivantes:

* Que faites-vous lorsque votre jeu de données n'est pas sur le Hub ?
* Comment pouvez-vous découper et trancher un ensemble de données ? (Et si vous avez _vraiment_ besoin d'utiliser Pandas ?)
* Que faites-vous lorsque votre ensemble de données est énorme et va faire fondre la RAM de votre ordinateur portable ?
* Qu'est-ce que c'est que le "mappage de la mémoire" et Apache Arrow ?
* Comment pouvez-vous créer votre propre ensemble de données et le pousser vers le Hub ?

Les techniques que vous apprenez ici vous prépareront aux tâches avancées de tokenisation et de réglage fin du [Chapitre 6](/course/chapter6) et du [Chapitre 7](/course/chapter7) -- alors prenez un café et commençons !
Loading