Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Bump release #381

Merged
merged 218 commits into from
Nov 22, 2022
Merged
Changes from 20 commits
Commits
Show all changes
218 commits
Select commit Hold shift + click to select a range
b759479
Chinese - Chapter 1 finished
yaoqih Apr 11, 2022
7db2d4e
Merge branch 'huggingface:main' into main
yaoqih Apr 12, 2022
8ec6fd3
Add zh to the languages field
yaoqih Apr 12, 2022
b931926
Remove untranslated chapters in _toctree.yml
yaoqih Apr 12, 2022
1aa5aa9
Merge branch 'huggingface:main' into main
yaoqih Apr 12, 2022
0778f36
Fixed an error in the translation format
yaoqih Apr 12, 2022
e7100c6
Added a small part of the missing content
yaoqih Apr 12, 2022
0990c77
Fix style
lewtun Apr 13, 2022
cfac53f
Merge remote-tracking branch 'upstream/main'
yaoqih Apr 26, 2022
fa0a047
Complete the translation of Chapters 0 and 2
yaoqih Apr 26, 2022
d65b6e9
Merge remote-tracking branch 'upstream/main'
yaoqih May 3, 2022
cfee90e
Fixed some bugs
yaoqih May 3, 2022
a2705ee
Add files via upload
yaoqih May 6, 2022
e76d10e
Merge branch 'huggingface:main' into main
yaoqih May 6, 2022
5157821
run make style to format chapter1 session3
yaoqih May 6, 2022
7c3c3f5
run make style to format code
yaoqih May 6, 2022
737c180
run make style to format code
yaoqih May 6, 2022
4823c13
Merge branch 'main' into 1375626371/main
lewtun May 12, 2022
15fc232
Fix style
lewtun May 12, 2022
a88b0bb
Chapter 2 Section 1 Bengali Translation (huggingface#72) (#168)
avishek-018 May 16, 2022
2e20395
[TH] Chapter 6 Section 1 and 2 (#171)
meanna May 16, 2022
dee8b18
[FA] CH1 / P1-2 (#142)
schoobani May 16, 2022
1abf819
Spanish Chapter 3: sections 1 & 2 (#162)
fordaz May 16, 2022
e260263
fix typos in bpe, wordpiece, unigram (#166)
KeremTurgutlu May 16, 2022
1781826
[FR] French Review (#186)
lbourdois May 16, 2022
ab803f3
Part 7: Training a causal... fixes (#179)
CakeCrusher May 17, 2022
6c78c3e
[TR] Translated Chapter 1.6 🤗 (#185)
tanersekmen May 17, 2022
1fe96c8
[PT][Chapter 01 - 2.mdx] - issue #51 (#170)
victorescosta May 17, 2022
d19424a
Fix Gradio ToC (#193)
lewtun May 18, 2022
b9548e9
Add Gradio authors and Blocks event (#189)
lewtun May 18, 2022
fbc9823
Update 6.mdx (#188)
couturierc May 18, 2022
af0bfc8
Add translating notes and glossary to Spanish (#192)
fordaz May 19, 2022
04d9444
add pt 4.3 (#191)
johnnv1 May 19, 2022
833ae2d
[FR] Visual corrections (#190)
lbourdois May 19, 2022
8226918
[PT] add chapter 4.4 and 4.5 (#196)
johnnv1 May 19, 2022
b6a2774
fix invite discord link (#197)
johnnv1 May 19, 2022
1302cef
[FA] Second draft of CH2/P1-2 (#139)
jowharshamshiri May 20, 2022
8b786d1
added chapter3 in hindi (#198)
robotjellyzone May 20, 2022
42d2030
[TR] Chapter 3/1 (#165)
Winvoker May 23, 2022
a340c81
[RU] Ch3-1/2/3 (#200)
pdumin May 23, 2022
b09e5fa
[PT] add 5.1 and 5.2 (#204)
johnnv1 May 23, 2022
6febc3e
Merge branch 'main' into prerelease-audio
lewtun May 24, 2022
e55809a
Add placeholders for audio chapters (#208)
lewtun May 24, 2022
3b081e9
[FA] - Ch3 - P1 and P2 (#199)
kambizG May 24, 2022
51a6c9f
[PT] add `end-of-chapter quiz` for chapter 4 (4.6) (#201)
johnnv1 May 24, 2022
751d069
Chapter1: 2.mdx Translated. (#206)
pandyaved98 May 24, 2022
9bf50f0
Remove comments from Persian ToC (#210)
lewtun May 24, 2022
b16fdff
Fix CI URL for PRs (#211)
lewtun May 24, 2022
d32eed6
Merge branch 'main' into prerelease-audio
lewtun May 24, 2022
e069fa0
Merge branch 'prerelease-audio' into add-audio-clf
lewtun May 24, 2022
db51446
code fragment & english syntax and meaning (#203)
CakeCrusher May 25, 2022
ef316d8
Updated Ch1/1 with Emoji (#214)
pandyaved98 May 25, 2022
62a824b
Add missing numpy import (#217)
lewtun May 25, 2022
7967b2b
Merge branch 'add-audio-clf'
yaoqih May 26, 2022
069f7df
Merge branch 'huggingface:main' into main
yaoqih May 26, 2022
7753f6a
Updata chapter3
yaoqih May 26, 2022
5f5c834
Code format for chapter3
yaoqih May 26, 2022
3885ff7
Updata yml file of chapter3
yaoqih May 26, 2022
76c59b2
Uptata yml file of chapter3
yaoqih May 26, 2022
54b4791
Fix yml file bug
yaoqih May 26, 2022
bc296c5
[ES] translate sections 8.1 and 8.2 (#215)
dzarkV May 27, 2022
4de9652
Fix path to datasets (#216)
listenaddress May 27, 2022
8545f05
[PT] add 5.3 (#218)
johnnv1 May 27, 2022
f66182e
fix 4.3 (#223)
johnnv1 May 27, 2022
4f10911
Run make style
yaoqih May 28, 2022
80b0fbd
Fix notebook generation (#227)
lewtun May 30, 2022
d9bef0c
add 5.4 (#226)
johnnv1 May 30, 2022
4052957
add pt wip (#225)
LincolnVS May 30, 2022
feff8a3
Added Gujarati List. (#221)
pandyaved98 May 30, 2022
7692aad
Merge branch 'main' into 1375626371/main
lewtun May 30, 2022
11ff5ec
Fix quality
lewtun May 30, 2022
1d9d9d3
Add Gradio nbs links to fr (#228)
lewtun May 30, 2022
d22cab9
Fix ToC tree
lewtun May 30, 2022
c930f3c
Remove audio templates
lewtun May 30, 2022
7363126
Merge branch 'main' into 1375626371/main
lewtun May 30, 2022
ac4d1b1
Fix fr section
lewtun May 30, 2022
7036ab1
Fix fr chapter
lewtun May 30, 2022
2302e48
Chinese - Chapter 3finished (#219)
yaoqih May 30, 2022
447c789
add ch7 at _toctree and translate 7.1 (#222)
LincolnVS May 30, 2022
52b8883
add 5.5 (#235)
johnnv1 Jun 9, 2022
7f5cc16
[FR] Review of chapter 7 (#233)
lbourdois Jun 9, 2022
4c74259
Italian translation - chapter 4 (#230)
ClonedOne Jun 9, 2022
097edcb
Added Thai translation of chapters 3 (#231)
meanna Jun 9, 2022
6dd7e6c
[Ru] Add part 2, chapter 2 (#234)
svv73 Jun 9, 2022
225c91d
Update 8.mdx (#237)
omerXfaruq Jun 9, 2022
85df4d9
Created HI/Chapter1/5.mdx (#232)
pandyaved98 Jun 14, 2022
e216c2f
Add Spanish chaper3/section4, update toc and glossary (#238)
fordaz Jun 17, 2022
77b3e15
[RU] Chapter 3 finished (#239)
pdumin Jun 17, 2022
3681c50
[PT] add 5.6 and 5.7 (#240)
johnnv1 Jun 17, 2022
9385a66
[EN] Visual corrections (#245)
lbourdois Jun 17, 2022
4b9dab4
Translation for 1/4, 1/5 and 1/6. (#247)
CaterinaBi Jun 17, 2022
e20a766
add event in PT (#250)
johnnv1 Jun 17, 2022
44690a3
Pin version of black (#252)
HiromuHota Jun 19, 2022
16efa44
Translate ja event (#241)
trtd56 Jun 20, 2022
456c608
[PT] add quiz chapter 5 (#243)
johnnv1 Jun 20, 2022
01231a1
Update 5.mdx (#253)
mehrdadnd Jun 20, 2022
3d5c36d
Translation for Traditional Chinese (zh-tw) chapter0 (#251)
thisistz Jun 20, 2022
4ebc0b9
Translated the whole Chapter 3 to Thai (#255)
a-krirk Jun 20, 2022
bd16058
Japanese chapter 4 (#244)
HiromuHota Jun 21, 2022
147496a
Translation of 1/7, 1/8, and 1/9. (#263)
CaterinaBi Jun 27, 2022
71f71e4
[PT] add chapter 8.1 and 8.2 (#265)
johnnv1 Jun 27, 2022
712d3b1
[RU] Chapter 4 (#269)
pdumin Jun 30, 2022
228a218
Add Thai translation for chapter 6.3b to 6.10 (#268)
meanna Jun 30, 2022
89c79d3
add 8.3 (#266)
johnnv1 Jun 30, 2022
a6cb07c
3.mdx of chapter 01 (#260)
victorescosta Jun 30, 2022
f5d6f46
Fix typo (#271)
atgctg Jul 5, 2022
b59a5ec
[PT] add chapter 6.1 (#273)
mdrs-thiago Jul 5, 2022
e46ab85
add Japanese chapter7 (#267)
webbigdata-jp Jul 6, 2022
cd9e36d
Merge branch 'huggingface:main' into main
yaoqih Jul 13, 2022
610d61c
zh-CN - Chapter 4,5finished
yaoqih Jul 13, 2022
d804922
replace `load_metric` with `evaluate.load` (#285)
lvwerra Jul 21, 2022
c34bfad
[GJ] Translation to Gujarati - Ch0 Setup (#287)
bhadreshpsavani Jul 25, 2022
eae6501
[PT] add chapter 6.2 and 6.3 (#279)
mdrs-thiago Jul 25, 2022
1537727
Fix formatting
lewtun Jul 25, 2022
6fed4f7
Merge branch 'main' into 1375626371/main
lewtun Jul 25, 2022
bb26db5
Debug formatting
lewtun Jul 25, 2022
69187a3
Debug FR formatting
lewtun Jul 25, 2022
69accea
zh-CN - Chapter 4,5finished (#281)
yaoqih Jul 25, 2022
be15274
Chapter 01 - Done [PT] #51 (#280)
victorescosta Jul 25, 2022
4656735
tf_default_data_collator seems to have moved
ehrencrona Jul 31, 2022
aebb46e
Merge branch 'huggingface:main' into main
yaoqih Aug 1, 2022
e69fce2
zh-CN - Chapter 6finished
yaoqih Aug 1, 2022
6403eaa
Revert "Merge branch 'huggingface:main' into main"
yaoqih Aug 1, 2022
43fc1f7
Revert "zh-CN - Chapter 6finished"
yaoqih Aug 1, 2022
2bf870d
zh-CN - Chapter 6finished
yaoqih Aug 1, 2022
ef3b87b
fix style
Aug 4, 2022
85f75d7
undo bad commit
Aug 4, 2022
a9b6d48
Merge pull request #289 from ehrencrona/tf_default_data_collator-moved
Rocketknight1 Aug 4, 2022
b4b2316
Merge pull request #290 from 1375626371/main
lvwerra Aug 4, 2022
0ef247f
Chapter5it (#278)
Nolanogenn Aug 15, 2022
8330d44
Vietnamese translation (#293)
honghanhh Aug 22, 2022
9828fd8
Translate JP chapter 8 (#249)
younesbelkada Aug 22, 2022
3d4e591
Italian translation - Chapter 8 (#272)
EdAbati Aug 22, 2022
57115d9
Translation to Vietnamese - chapter 5 (#297)
honghanhh Aug 23, 2022
7a7d48d
Add course contributors (#298)
lewtun Aug 23, 2022
3c6b8bb
Add CourseFloatingBanner component
mishig25 Aug 23, 2022
358f7cc
DocNotebookDropdown -> CourseFloatingBanner
mishig25 Aug 23, 2022
dbe0c28
Merge pull request #301 from huggingface/add_question_banner
mishig25 Aug 31, 2022
d0c1d6a
Italian translation Ch 2/1, 2/2 (#300)
gdacciaro Sep 2, 2022
e2f2597
Add contributors (#304)
lewtun Sep 2, 2022
0c00f58
Add forum button (#306)
lewtun Sep 2, 2022
ececc02
Translate into Vietnamese chap [6-9] - DONE (#303)
honghanhh Sep 2, 2022
8f1ba9a
Italian translation: Chapter 3 (#283)
sharkovsky Sep 2, 2022
2c0b3ba
Enable notebooks to be generated in any language (#311)
lewtun Sep 13, 2022
5536b4a
Generate notebooks for all languages (#313)
lewtun Sep 13, 2022
796f41d
Update notebook links (#312)
lewtun Sep 13, 2022
7a4a051
minor change to avoid confusion in ch2-5 (#310)
daspartho Sep 13, 2022
0b89f2d
Refactor tokenization of targets for transformers v4.22 (#316)
lewtun Sep 19, 2022
bb7fde4
typo fix (#319)
Aravindkumar-Rajendran Sep 23, 2022
611a24e
[FR] Many corrections (#318)
lbourdois Sep 23, 2022
e4a5c2d
Fix URL to the Pile (#324)
lewtun Oct 3, 2022
3b6e294
[RU] ch5 (#317)
pdumin Oct 3, 2022
d7cd693
fix: book url (#323)
buti1021 Oct 3, 2022
1b3e60a
zh-CN - Chapter 7,8,9finished (#315)
yaoqih Oct 4, 2022
2a61a64
Refactor events (#261)
lewtun Oct 4, 2022
4cd2c0e
Fix whole word masking labels (#326)
lewtun Oct 4, 2022
85019bc
Fix question answering indices (#327)
lewtun Oct 4, 2022
32b2bda
Add translation checker (#329)
lewtun Oct 5, 2022
c163e9c
[FR] Refactor events (#330)
lbourdois Oct 5, 2022
288108f
Translation Chapter 4 (#325)
fabridamicelli Oct 5, 2022
304a522
update author list (de) (#331)
fabridamicelli Oct 5, 2022
0ed1969
Fix Russian ToC (#332)
lewtun Oct 5, 2022
9f65007
Refactor dataset upload in Chapter 5 / section 5 (#334)
lewtun Oct 7, 2022
448547b
Fix id2label types (#337)
lewtun Oct 10, 2022
68ca3e8
Fix keywords in de quiz chapter 3 (#338)
JesperDramsch Oct 10, 2022
271ec19
Tweak course validator (#340)
lewtun Oct 12, 2022
b68c438
[Italian] Added Ch2/3 and Ch2/4 (#322)
gdacciaro Oct 12, 2022
6e652fe
Completes chapter 1 (#341)
CaterinaBi Oct 17, 2022
da4f696
Create 5.mdx and translate it into Japanese.
haruki-N Oct 18, 2022
97cd752
Create 6.mdx and translate it into Japanese.
haruki-N Oct 18, 2022
fabab7a
done chapter1.2,1.3
blackdoor571 Oct 21, 2022
2d45514
Create 4.mdx and translate it into Japanese.
haruki-N Oct 23, 2022
cd419a2
Slightly modified
haruki-N Oct 23, 2022
6fcb795
Slightly modified
haruki-N Oct 23, 2022
ca7dd53
Slightly modified
haruki-N Oct 23, 2022
c433132
TF generation fixes (#344)
Rocketknight1 Oct 28, 2022
16e0528
i18n: ES - translate file chapter2/6.mdx (#346)
hereje Oct 28, 2022
be7e245
Typo in russian translation (#349)
vood Oct 28, 2022
fd49e93
Remove translated string (#350)
vood Oct 28, 2022
f5d8039
[It] Ch2/5, Ch2/6, Ch2/7 (#353)
gdacciaro Oct 28, 2022
3d5c446
Add FAQ (#354)
lewtun Oct 28, 2022
d95d89f
i18n: ES - translate file chapter2/7.mdx (#347)
hereje Oct 28, 2022
ed04da0
[id] Add translation to Bahasa Indonesia for chapter0 & some of chapt…
gstdl Oct 28, 2022
fcef635
i18n: ES - chapter2/8.mdx (#352)
hereje Oct 28, 2022
e1c9aa3
Update 4.mdx based on the advice.
haruki-N Nov 1, 2022
e044813
[de] Translation Chapter 1 (#336)
MarcusFra Nov 1, 2022
1bab3b7
Update 1.mdx (#356)
cakiki Nov 2, 2022
d12ccdb
Update 1.mdx (#357)
cakiki Nov 2, 2022
97f072e
removed original english texts to open pull request
haruki-N Nov 3, 2022
fed8595
removed original english texts to open pull request
haruki-N Nov 3, 2022
7d07be8
removed original english texts to open pull request
haruki-N Nov 3, 2022
9b42858
add lines for chap1/4 to 6
haruki-N Nov 3, 2022
6a1edd9
Slightly modified
haruki-N Nov 3, 2022
3b6de2b
modify 2.mdx, 3.mdx
blackdoor571 Nov 4, 2022
5f2493a
modify _toctree.yml
blackdoor571 Nov 4, 2022
44f77be
Update pr docs actions (#369)
mishig25 Nov 8, 2022
db20ca5
Add Python syntax highlighting (#370)
davidgilbertson Nov 9, 2022
36b44d1
[FR] Add FAQ and more (#367)
lbourdois Nov 9, 2022
531e3f0
[RU] Chapter 6 (1/2) finished (#368)
pdumin Nov 9, 2022
fe38085
Spanish translation of Chapter 5 (#366)
camartinezbu Nov 9, 2022
972bcd2
Add Japanese trasnlation of chapter 1/ 7 to 10 (#359)
hiro819 Nov 10, 2022
a44a66a
Adding Portuguese Translation to Chapter3 (#361)
Cesar0106 Nov 10, 2022
f7fa7fa
Merge branch 'main' into main
younesbelkada Nov 10, 2022
d3ba0d8
Merge branch 'main' into main
younesbelkada Nov 10, 2022
7a365f3
make style
younesbelkada Nov 10, 2022
eeab1f0
Merge pull request #360 from haruki-N/main
younesbelkada Nov 10, 2022
e8fce4c
Merge branch 'main' into main
younesbelkada Nov 10, 2022
7081ab6
Merge pull request #363 from blackdoor571/main
younesbelkada Nov 10, 2022
bde9ef4
Typo in Chapter 2, Section 2 (#364)
filippo82 Nov 11, 2022
d54c30c
Revert "Update pr docs actions (#369)"
Nov 16, 2022
8c1bf18
Merge pull request #372 from huggingface/revert-369-update_doc_pr_act…
mishig25 Nov 16, 2022
e04fe8b
Typo (#374)
donglihe-hub Nov 18, 2022
d00c646
Chapter 9 - Italian (#373)
EdAbati Nov 18, 2022
2a6767d
Fix notebook link (#378)
lewtun Nov 22, 2022
31658da
docs: feat: chapter2-1 in Korean (#375)
wonhyeongseo Nov 22, 2022
e328700
Migrate Spaces URLs to new domain (#379)
lewtun Nov 22, 2022
92c615d
docs: feat: same links across languages (#380)
wonhyeongseo Nov 22, 2022
d75f6ca
Merge branch 'release' into bump_release
lewtun Nov 22, 2022
File filter

Filter by extension

Filter by extension


Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
2 changes: 1 addition & 1 deletion .github/workflows/build_documentation.yml
Original file line number Diff line number Diff line change
@@ -14,6 +14,6 @@ jobs:
package: course
path_to_docs: course/chapters/
additional_args: --not_python_module
languages: ar bn de en es fa fr gj he hi it ja ko pt ru th tr vi zh-CN zh-TW
languages: ar bn de en es fa fr gj he hi id it ja ko pt ru th tr vi zh-CN zh-TW
secrets:
token: ${{ secrets.HUGGINGFACE_PUSH }}
7 changes: 5 additions & 2 deletions .github/workflows/build_pr_documentation.yml
Original file line number Diff line number Diff line change
@@ -9,12 +9,15 @@ concurrency:

jobs:
build:
uses: huggingface/doc-builder/.github/workflows/build_pr_documentation.yml@main
uses: huggingface/doc-builder/.github/workflows/build_pr_documentation.yml@use_hf_hub
with:
commit_sha: ${{ github.event.pull_request.head.sha }}
pr_number: ${{ github.event.number }}
package: course
path_to_docs: course/chapters/
additional_args: --not_python_module
languages: ar bn de en es fa fr gj he hi it ja ko pt ru th tr vi zh-CN zh-TW
languages: ar bn de en es fa fr gj he hi id it ja ko pt ru th tr vi zh-CN zh-TW
hub_base_path: https://moon-ci-docs.huggingface.co
secrets:
token: ${{ secrets.HF_DOC_PUSH }}
comment_bot_token: ${{ secrets.HUGGINGFACE_PUSH }}
7 changes: 5 additions & 2 deletions .github/workflows/delete_doc_comment.yml
Original file line number Diff line number Diff line change
@@ -7,7 +7,10 @@ on:

jobs:
delete:
uses: huggingface/doc-builder/.github/workflows/delete_doc_comment.yml@main
uses: huggingface/doc-builder/.github/workflows/delete_doc_comment.yml@use_hf_hub
with:
pr_number: ${{ github.event.number }}
package: course
package: course
secrets:
token: ${{ secrets.HF_DOC_PUSH }}
comment_bot_token: ${{ secrets.HUGGINGFACE_PUSH }}
1 change: 1 addition & 0 deletions README.md
Original file line number Diff line number Diff line change
@@ -15,6 +15,7 @@ This repo contains the content that's used to create the **[Hugging Face course]
| [Gujarati](https://huggingface.co/course/gu/chapter1/1) (WIP) | [`chapters/gu`](https://github.com/huggingface/course/tree/main/chapters/gu) | [@pandyaved98](https://github.com/pandyaved98) |
| [Hebrew](https://huggingface.co/course/he/chapter1/1) (WIP) | [`chapters/he`](https://github.com/huggingface/course/tree/main/chapters/he) | [@omer-dor](https://github.com/omer-dor) |
| [Hindi](https://huggingface.co/course/hi/chapter1/1) (WIP) | [`chapters/hi`](https://github.com/huggingface/course/tree/main/chapters/hi) | [@pandyaved98](https://github.com/pandyaved98) |
| [Bahasa Indonesia](https://huggingface.co/course/id/chapter1/1) (WIP) | [`chapters/id`](https://github.com/huggingface/course/tree/main/chapters/id) | [@gstdl](https://github.com/gstdl) |
| [Italian](https://huggingface.co/course/it/chapter1/1) (WIP) | [`chapters/it`](https://github.com/huggingface/course/tree/main/chapters/it) | [@CaterinaBi](https://github.com/CaterinaBi), [@ClonedOne](https://github.com/ClonedOne), [@Nolanogenn](https://github.com/Nolanogenn), [@EdAbati](https://github.com/EdAbati), [@gdacciaro](https://github.com/gdacciaro) |
| [Japanese](https://huggingface.co/course/ja/chapter1/1) (WIP) | [`chapters/ja`](https://github.com/huggingface/course/tree/main/chapters/ja) | [@hiromu166](https://github.com/@hiromu166), [@younesbelkada](https://github.com/@younesbelkada), [@HiromuHota](https://github.com/@HiromuHota) |
| [Korean](https://huggingface.co/course/ko/chapter1/1) (WIP) | [`chapters/ko`](https://github.com/huggingface/course/tree/main/chapters/ko) | [@Doohae](https://github.com/Doohae) |
24 changes: 24 additions & 0 deletions chapters/de/_toctree.yml
Original file line number Diff line number Diff line change
@@ -3,6 +3,30 @@
- local: chapter0/1
title: Einführung

- title: 1. Transformer-Modelle
sections:
- local: chapter1/1
title: Einführung
- local: chapter1/2
title: Natural Language Processing
- local: chapter1/3
title: Transformer-Modelle - wozu sind sie imstande?
- local: chapter1/4
title: Wie funktionieren Transformer-Modelle?
- local: chapter1/5
title: Encoder-Modelle
- local: chapter1/6
title: Decoder-Modelle
- local: chapter1/7
title: Sequence-to-Sequence-Modelle
- local: chapter1/8
title: Bias und Einschränkungen
- local: chapter1/9
title: Zusammenfassung
- local: chapter1/10
title: Quiz am Ende des Kapitels
quiz: 1

- title: 3. Fine-tuning von vortrainierten Modellen
sections:
- local: chapter3/1
102 changes: 102 additions & 0 deletions chapters/de/chapter1/1.mdx
Original file line number Diff line number Diff line change
@@ -0,0 +1,102 @@
# Einführung

<CourseFloatingBanner
chapter={1}
classNames="absolute z-10 right-0 top-0"
/>

## Willkommen zum 🤗 Kurs!

<Youtube id="00GKzGyWFEs" />

In diesem Kurs lernst du verschiedene Teilbereiche der maschinellen Verarbeitung natürlicher Sprache (engl. Natural Language Processing, NLP) - im Deutschen auch als Maschinelle Sprachverarbeitung oder Computerlinguistik (CL) bezeichnet - unter Verwendung der Bibliotheken des Ökosystems von [Hugging Face](https://huggingface.co/) kennen: die [🤗 Transformers-](https://github.com/huggingface/transformers), die [🤗 Datasets-](https://github.com/huggingface/datasets), die [🤗 Tokenizers-](https://github.com/huggingface/tokenizers) sowie die [🤗 Accelerate-Bibliotheken](https://github.com/huggingface/accelerate) als auch der [Hugging Face Hub](https://huggingface.co/models). Der Kurs ist komplett kostenlos und frei von Werbung.


## Was erwartet dich?

Hier ein kurzer Überblick über den Kurs:

<div class="flex justify-center">
<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/summary.svg" alt="Brief overview of the chapters of the course.">
<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/summary-dark.svg" alt="Brief overview of the chapters of the course.">
</div>

- Die Kapitel 1 bis 4 geben eine Einführung in die wichtigsten Konzepte der 🤗 Transformers-Bibliothek. Am Ende dieses Teils des Kurses wirst du mit der Funktionsweise von Transformer-Modellen vertraut sein und wissen, wie du ein Modell aus dem [Hugging Face Hub](https://huggingface.co/models) verwendest, es auf einem Datensatz feintunst und deine Ergebnisse mit anderen auf dem Hub teilst!
- In den Kapiteln 5 bis 8 lernst du die Grundlagen der 🤗 Datasets- und 🤗 Tokenizers-Bibliotheken kennen, bevor du in die typischen Problemstellungen des NLP eintauchst. Am Ende dieses Teils wirst du in der Lage sein, die gängisten Problemstellungen im NLP selbstständig zu lösen.
- Die Kapitel 9 bis 12 gehen über den Bereich des NLP hinaus und zeigen, wie Transformer-Modelle für Aufgaben bei der Verarbeitung gesprochener Sprache (engl. Speech Processing) und im Bereich Computer Vision (im Deutschen ungefähr mit computerbasiertem Sehen zu übersetzen) eingesetzt werden können. Nebenbei lernst du, wie du eigene Versionen deiner Modelle zu Demonstrationszwecken erstellen und sie mit anderen teilen kannst, und wie du sie für Produktionsumgebungen optimierst. Am Ende dieses Teils wirst du in der Lage sein, die 🤗 Transformers-Bibliothek auf (fast) jede Problemstellung, die dir im Bereich des Maschinellen Lernens begegnen, anzuwenden!

Dieser Kurs:

* Erfordert gute Kenntnisse in Python
* Sollte am besten nach einem Einführungskurs in Deep Learning gemacht werden, wie z. B. [fast.ai's Kurs](https://www.fast.ai/) [Practical Deep Learning for Coders](https://course.fast.ai/) oder eines der von [DeepLearning.AI](https://www.deeplearning.ai/) entwickelten Kursprogramme
* Setzt keine Vorkenntnisse in [PyTorch](https://pytorch.org/) oder [TensorFlow](https://www.tensorflow.org/) voraus, obwohl es hilfreich ist, wenn du bereits mit ihnen vertraut sein solltest.

Nachdem du diesen Kurs abgeschlossen hast, empfehlen wir dir den [Spezialisierungskurs Natural Language Processing von DeepLearning.AI](https://www.coursera.org/specializations/natural-language-processing?utm_source=deeplearning-ai&utm_medium=institutions&utm_campaign=20211011-nlp-2-hugging_face-page-nlp-refresh), der eine breite Palette traditioneller NLP-Modelle wie Naive Bayes und LSTMs abdeckt, bei denen es sich lohnt, sich mit ihnen vertraut zu machen!

## Wer sind wir?

Über die Autorinnen und Autoren:

**Matthew Carrigan** ist Machine Learning Engineer bei Hugging Face. Er lebt in der irischen Hauptstadt Dublin und hat zuvor als Machine Learning Engineer bei Parse.ly und als Post-Doktorand am Trinity College Dublin gearbeitet. Er glaubt nicht, dass wir eine künstliche allgemeine Intelligenz (engl. Artificial General Intelligence, AGI) durch eine zunehmende Skalierung bestehender Architekturen erreichen werden, hat aber dennoch die Hoffnung, dass Roboter auf dem Weg zur Unsterblichkeit sind.

**Lysandre Debut** ist Machine Learning Engineer bei Hugging Face und arbeitet bereits seit Entstehung an der 🤗 Transformers-Bibliothek mit. Sein Ziel ist es, NLP für alle zugänglich zu machen, indem er Tools entwickelt, die eine sehr einfache API bieten.

**Sylvain Gugger** ist Research Engineer bei Hugging Face und einer der Hauptverantwortlichen für die Pflege der 🤗 Transformers-Bibliothek. Zuvor war er Research Scientist bei fast.ai und hat zusammen mit Jeremy Howard das Buch _[Deep Learning for Coders with fastai and PyTorch](https://learning.oreilly.com/library/view/deep-learning-for/9781492045519/)_ verfasst. Seine Forschung ist darauf ausgerichtet, Deep Learning zugänglicher zu machen. Hierfür entwickelt und verbessert er Techniken, mit denen Modelle auch bei begrenzter Ressourcenausstattung auf schnelle Weise trainiert werden können.

**Merve Noyan** ist Developer Advocate bei Hugging Face und arbeitet daran, Tools zu entwickeln und Inhalte zu erstellen, die Maschinelles Lernen für jeden zugänglich machen.

**Lucile Saulnier** ist Machine Learning Engineer bei Hugging Face und entwickelt und unterstützt die Nutzung von Open-Source-Tools. Außerdem ist sie aktiv an vielen Forschungsprojekten im Bereich des NLP beteiligt, z. B. an kollaborativem Training und BigScience.

**Lewis Tunstall** ist Machine Learning Engineer bei Hugging Face, und konzentriert sich darauf, Open-Source-Tools zu entwickeln und sie der breiten Community zugänglich zu machen. Zudem ist er Mitverfasser des O'Reilly-Buches [Natural Language Processing with Transformers](https://www.oreilly.com/library/view/natural-language-processing/9781098136789/).

**Leandro von Werra** ist Machine Learning Engineer im Open-Source-Team von Hugging Face und ebenfalls einer der Autoren des O'Reilly-Buches [Natural Language Processing with Transformers](https://www.oreilly.com/library/view/natural-language-processing/9781098136789/). Er hat mehrere Jahre praktische Erfahrung darin gesammelt, NLP-Projekte in die Produktion zu bringen, und dabei den gesamten ML-Stack beackert.

## Häufig gestellte Fragen (FAQ)

Hier findest du einige Antworten auf häufig gestellte Fragen:

- **Erhalte ich für die Teilnahme an diesem Kurs ein Zertifikat?
Derzeit gibt es für diesen Kurs noch kein Zertifikat. Wir arbeiten jedoch an einem Programm zur Erlangung eines Zertifikats für das Hugging-Face-Ökosystem - bleib' auf dem Laufenden!

- **Wie viel Zeit sollte ich für diesen Kurs einplanen?
Jedes Kapitel dieses Kurses ist so konzipiert, dass es innerhalb einer Woche abgeschlossen werden kann, wenn du circa 6 bis 8 Stunden Arbeit einplanst. Du kannst dir jedoch so viel Zeit nehmen wie nötig.

- **Wo kann ich Fragen stellen, wenn ich welche habe?**
Wenn du eine Frage zu einem Kursabschnitt hast, klicke einfach auf das sich oben auf der Seite befindende Banner "*Ask a question*" und du wirst automatisch zum entsprechenden Bereich des [Hugging-Face-Forums](https://discuss.huggingface.co/) weitergeleitet:

<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/forum-button.png" alt="Link to the Hugging Face forums" width="75%">

Wenn du nach dem Kurs noch weiter üben möchtest, steht dir in den Foren eine Liste mit [Projektideen](https://discuss.huggingface.co/c/course/course-event/25) zur Verfügung.

- **Wo finde ich den Code für den Kurs?**
In jedem Abschnitt kannst du auf das oben auf der Seite befindliche Banner klicken, um den Code entweder in Google Colab oder in Amazon SageMaker Studio Lab auszuführen:

<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/notebook-buttons.png" alt="Link to the Hugging Face course notebooks" width="75%">

Die Jupyter-Notebooks, die den gesamten Code des Kurses enthalten, befinden sich im [`huggingface/notebooks`-Repo](https://github.com/huggingface/notebooks). Wenn du sie lokal aufsetzen möchtest, schau dir die Anweisungen im [`course`-Repository](https://github.com/huggingface/course#-jupyter-notebooks) auf GitHub an.


- **Wie kann ich etwas zum Kurs beitragen?**
Es gibt mehrere Möglichkeiten, zum Kurs beizutragen! Wenn du einen Tippfehler oder einen Fehler entdeckst, eröffne bitte ein Issue in dem [`course`-Repository](https://github.com/huggingface/course). Wenn du uns dabei unterstützen möchtest, den Kurs in deine Muttersprache zu übersetzen, sieh dir bitte die [Anleitung](https://github.com/huggingface/course#translating-the-course-into-your-language) an.

- **Welche Entscheidungen wurden bei den einzelnen Übersetzungen getroffen?**
Für jede Übersetzung gibt es ein Glossar und die Datei `TRANSLATING.txt`, in der die gewählten Fachtermini usw. festgehalten sind. Ein Beispiel für die deutsche Fassung findest du [hier](https://github.com/huggingface/course/blob/main/chapters/de/TRANSLATING.txt).


- **Kann ich diesen Kurs auch an anderer Stelle verwenden?**
Ja, natürlich! Der Kurs ist unter der permissiven [Apache-2-Lizenz](https://www.apache.org/licenses/LICENSE-2.0.html) veröffentlicht. Das bedeutet, dass du den Kurs in angemessener Weise erwähnen, einen Verweis zur Lizenz angeben und darauf hinweisen musst, wenn du Änderungen vorgenommen hast. Du kannst dies in jeder angemessenen Weise tun, allerdings nicht in einer Weise, die den Eindruck erweckt, dass der Lizenzgeber dich oder deine Nutzung unterstützt. Wenn du den Kurs zitieren möchtest, verwende bitte den folgenden BibTeX-Eintrag:

```
@misc{huggingfacecourse,
author = {Hugging Face},
title = {The Hugging Face Course, 2022},
howpublished = "\url{https://huggingface.co/course}",
year = {2022},
note = "[Online; accessed <today>]"
}
```

Bist du bereit, loszulegen? In diesem Kapitel lernst du
* wie man die Funktion `pipeline()` benutzt, um computerlinguistische Aufgaben wie Textgenerierung und Klassifizierung zu lösen,
* mehr über die Transformer-Architektur und
* wie zwischen Encoder-, Decoder- und Encoder-Decoder-basierten Architekturen und -Anwendungsfällen unterschieden werden kann.
Loading