Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

TR Translation of "Fine-tuning a Code LLM on Custom Code on a single … #218

Open
wants to merge 6 commits into
base: main
Choose a base branch
from

Conversation

emre570
Copy link
Contributor

@emre570 emre570 commented Oct 24, 2024

@merveenoyan This PR includes Turkish translation of "Fine-tuning a Code LLM on Custom Code on a single GPU" by Maria Khalusova with translated toctree YAML file.

Copy link

Check out this pull request on  ReviewNB

See visual diffs & provide feedback on Jupyter Notebooks.


Powered by ReviewNB

@onuralpszr
Copy link
Contributor

Merhaba @emre570 👋 , yardımcı olmak adına bariz gördüğüm bir kaç yazım için review bırakıyorum.

@@ -0,0 +1,1127 @@
{
Copy link
Contributor

@onuralpszr onuralpszr Oct 25, 2024

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

not defterinde -> "notebook'ta"


Reply via ReviewNB

@@ -0,0 +1,1127 @@
{
Copy link
Contributor

@onuralpszr onuralpszr Oct 25, 2024

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Parametre açısından verimli eğitim teknikleri kullanarak, bu dizüstü bilgisayarı tek bir A100 High-RAM GPU üzerinde çalıştırabiliriz.

Parametre açısından verimli eğitim teknikleri kullanarak, bu dizüstü bilgisayarı veya tek bir A100 High-RAM GPU üzerinde çalıştırabiliriz.


Reply via ReviewNB

@@ -0,0 +1,1127 @@
{
Copy link
Contributor

@onuralpszr onuralpszr Oct 25, 2024

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Streaming, tüm veri setini bir kerede indirmek yerine veri seti üzerinde işlem yaptıkça verileri kademeli olarak yüklememizi sağlar.

Streaming modu, tüm veri setini bir kerede indirmek yerine veri seti üzerinde işlem yaptıkça verileri kademeli olarak yüklememizi sağlar.


Reply via ReviewNB

@@ -0,0 +1,1127 @@
{
Copy link
Contributor

@onuralpszr onuralpszr Oct 25, 2024

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Tanımlandıktan sonra, hem eğitim hem de validation verilerinden ConstantLengthDataset örnekleri oluşturabiliriz.

Tanımlandıktan sonra, hem eğitim hem de doğrulama verilerinden ConstantLengthDataset örnekleri oluşturabiliriz.


Reply via ReviewNB

@@ -0,0 +1,1127 @@
{
Copy link
Collaborator

@merveenoyan merveenoyan Oct 26, 2024

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Türkçeye çevirirken cümleler biraz uzun oluyormuş onu farkettim, bir kaç öneri bırakıyorum

Codex, StarCoder ve Code Llama gibi açık kaynak dil modelleri genel programlama ilkelerine ve sözdizimine uygun kod üretme konusunda harikadır. Fakat bu modeller, bir kuruluşun dahili kurallarıyla uyumlu olmayabilir veya özel kütüphanelerden haberdar olmayabilir.*


Reply via ReviewNB

@@ -0,0 +1,1127 @@
{
Copy link
Collaborator

@merveenoyan merveenoyan Oct 26, 2024

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

hiperparametre diye çevirebiliriz değişken variable gibi oluyor daha gelişigüzel gibi


Reply via ReviewNB

@@ -0,0 +1,1127 @@
{
Copy link
Collaborator

@merveenoyan merveenoyan Oct 26, 2024

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

veri kümesi yerine veriseti daha çok kullanılıyor


Reply via ReviewNB

Made changes from reviews and some small adjustments
@emre570
Copy link
Contributor Author

emre570 commented Oct 27, 2024

@merveenoyan @onuralpszr incelediğiniz yerleri düzelttim ve birkaç yere de küçük düzeltmeler yaptım, müsait olduğunuzda bakabilirsiniz

@merveenoyan
Copy link
Collaborator

@emre570 bana uygun, @onuralpszr de tamamsa merge edebiliriz.
index.md dosyası oluşturup bu recipe'yi oraya ekleyebilir misin?

@emre570
Copy link
Contributor Author

emre570 commented Oct 27, 2024

@emre570 bana uygun, @onuralpszr de tamamsa merge edebiliriz. index.md dosyası oluşturup bu recipe'yi oraya ekleyebilir misin?

toctree dosyasını çevirip eklemiştim ama md dosyasına ne yazacağım?

@onuralpszr
Copy link
Contributor

onuralpszr commented Oct 27, 2024

Dizin ile alakalı;

@emre570 @merveenoyan dökümanına göre, "tr-TR" değilde sadece "tr" olmalı ise dizin değişmeli

src : https://www.loc.gov/standards/iso639-2/php/code_list.php

Eğer tr-TR olacaksa benim değiştirmem lazım

@@ -0,0 +1,1129 @@
{
Copy link
Contributor

@onuralpszr onuralpszr Oct 27, 2024

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Maria Khalusova tarafından hazırlanmıştır. <-- Bunun yerine kısa olarak aşağıdaki gibi olsa daha iyi olur.

Yazar : Maria Khalusova

Diğer düzenlediğim dökümanda aynı bu şekilde yazmaktadır.

Örnek :

_Yazar: [Sergio Paniego](https://github.com/sergiopaniego)_


Reply via ReviewNB

Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

yanına çeviren diye ekleye de bilirsiniz

@merveenoyan
Copy link
Collaborator

açıkçası çok güçlü bir görüşüm yok @emre570 @onuralpszr Korean'i ko Ingilizce'yi en diye yazmışız, tr olsa da olur

@emre570
Copy link
Contributor Author

emre570 commented Oct 27, 2024

Tamamdır düzenleyip yolluyoum şimdi

@@ -0,0 +1,1129 @@
{
Copy link
Contributor

@onuralpszr onuralpszr Oct 27, 2024

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Kod tamamlamasını sağlamak için tek yapmamız gereken, get_code_complete fonksiyonunu çağırmak ve tamamlanmasını istediğimiz ilk birkaç satırı önek olarak, boş bir dizeyi ise sonek olarak geçmek.

Kodun tamamlamasını sağlamak için tek yapmamız gereken, get_code_complete fonksiyonunu çağırmak ve tamamlanmasını istediğimiz ilk birkaç satırı önek olarak, boş bir dizeyi ise sonek olarak geçmek.


Reply via ReviewNB

Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

sonek suffix mi 😮 ilginç 😂

@@ -0,0 +1,1129 @@
{
Copy link
Contributor

@onuralpszr onuralpszr Oct 27, 2024

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Inference için modeli çağırdığımız hücreye geri dönerseniz ve fine-tune edilmiş ağırlıkları birleştirdiğimiz satırları yorum satırına eklerseniz, orijinal modelin tam olarak aynı önek için ne üreteceğini görebilirsiniz

Modeli Inference için başlattığımız notebook hücresine geri dönersek ve Fine-Tune edilmiş Weights ile birleştirdiğimiz satırları yoruma alırsanız, aynı önek için orijinal modelin ne üreteceğini görebilirsiniz.


Reply via ReviewNB

Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

örnek* olacak aslında. bir de fine-tune yazsak olacak capitalize etmemize gerek yok

@onuralpszr
Copy link
Contributor

@merveenoyan "ağırlık" mı ya da "weights" mi o konuda fikrini almak isterim.

@merveenoyan
Copy link
Collaborator

ağırlık kalsın bence. terimleri çevirmemek burada ne kadar doğru bilmiyorum fakat bazı terimlerde altını doldurmuyor gerçekten.

@merveenoyan
Copy link
Collaborator

@emre570 @onuralpszr 'in PR'ı merge ettik, upstream main'i buraya merge edersen hem Türkçe için CI, hem toctree hem index gelecek

@emre570
Copy link
Contributor Author

emre570 commented Oct 27, 2024

Merge ettim, toctree'ye ve index.md'ye de ekleme yaptım

@emre570
Copy link
Contributor Author

emre570 commented Nov 2, 2024

@merveenoyan @onuralpszr build hata verdi sanırım birkaç gün oldu, müsait bir vaktinizde bakabilir misiniz?

@onuralpszr
Copy link
Contributor

@emre570 CI kısmı build timeout oluyor. HuggingFace tarafına ait custom bir github action onun ile alakalı issue açtım bakarlarsa düzelir diye düşünüyorum. Colab içinde tekrar bakacağım.

@emre570
Copy link
Contributor Author

emre570 commented Dec 7, 2024

@merveenoyan @onuralpszr Merhaba, 1 aydan fazla oldu. Herhangi bir gelişme var mı?

@onuralpszr
Copy link
Contributor

@merveenoyan @onuralpszr Merhaba, 1 aydan fazla oldu. Herhangi bir gelişme var mı?

Öncesinde doc pr github action sorunu yeni çözüldü istersen branch merge yap sonrasında ben tekrar bir bakarım. Ama merge bende değil :)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

3 participants