errata

「大規模言語モデル入門」正誤表

下記の誤りについて、お詫びして訂正いたします。

誤植を見つけられた方は、Issuesに新しいissueを作っていただくか、書籍の問い合わせフォームからお知らせください。

該当箇所	誤	正	対応	媒体
4.1節	FLOPS（FLoating-point Operations Per Second）	FLOPs（FLoating-point Operations）		全て
5.4.1節末尾のコード	`# JSTSでファインチューニングしたモデルのpipelineを読み込む`	`# JNLIでファインチューニングしたモデルのpipelineを読み込む`		全て
5.5.2節	「5.2節では TrainingArguments に gradient_accumulation_steps の値を指定して勾配累積を有効にしています。」	「5.2節では TrainingArguments に gradient_accumulation_steps の値を指定することで勾配累積を有効にできます。」		全て
5.5.3節図5.16キャプション	「灰色部わか保持されている」	「灰色部分が保持されている」	3刷	全て
5.5.4節	コードのセルに番号がない	コードのセルに番号が付く	3刷	全て
6.1節	「テキストうえで」	「テキスト上で」	3刷	全て
6.2.3節: `from seqeval.metrics import classification_report`の前の行 7.4.1節: `from transformers import BatchEncoding, PreTrainedTokenizer`の前の行		`from typing import Any`	3刷	全て
6.2.3節: `convert_results_to_labels`関数 6.3.1節: `preprocess_data`関数 6.3.2節: `run_prediction`関数、`extract_entities`関数 6.3.5節: `find_error_results`関数、`output_text_with_label`関数 6.3.6節: `run_prediction_viterbi`関数 6.3.7節: `run_prediction_crf`関数 7.4.1節: `preprocess_data`関数 7.4.2節: `run_generation`関数、`postprocess_title`関数	関数の型ヒントの`any`	`Any`	3刷	全て
6.3.3節: `if best_score < scores["f1-score"]:`の次の行 6.3.7節: `if best_score < scores["f1-score"]:`の次の行		`best_score = scores["f1-score"]`を追加		全て
6.3.7節: `BertWithCrfForTokenClassification`クラスの`forward`メソッド	`attention_mask: torch.Tensor = None, token_type_ids: torch.Tensor = None, labels: torch.Tensor = None,`	`attention_mask: torch.Tensor \| None = None, token_type_ids: torch.Tensor \| None = None, labels: torch.Tensor \| None = None,`	3刷	全て
7.3節	n-gramに関する説明が繰り返されて表記されている	繰り返された表記を削除	2刷	ePubのみ
7.3.1節: `compute_rouge`関数 7.3.2節: `compute_blue`関数 7.3.3節 `compute_bertscore`関数	`datasets`の`load_metrics`関数の廃止	ツールを直で利用 (詳細はchapter07/7-summarization-generation.ipynbのコードを参照)
7.3.1節:	「`datasets`ライブラリの`load_metric`関数を用いて、」
7.3.2節:	「ROUGEと同様に`load_metric`関数を用いて、」
7.3.2節: `compute_bleu`関数	`references: list[str]`	`references: list[list[str]]`	3刷	全て
7.4.2節: `run_generation`関数	`batch = {k: v.to(model.device) for k, v in batch.items()}`	`batch = {k: v.to(model.device) for k, v in batch.items() if k != "labels"}`
7.4.2節	`ref_titles = [[tagger.parse(r["title"]).strip()] for r in results]`	`ref_titles = [[tagger.parse(r["title"]).strip() for r in results]]`
7.5.2節	「トークンからはじまり、まず5%の確率で「私達」が選ばれ、次に90%の確率で「の」が選ばれています。」	「トークンからはじまり、まず10%の確率で「私達」が選ばれ、次に70%の確率で「の」が選ばれています。」	3刷	全て
8.3.1節: `SimCSEModel`クラスの`encode_texts`メソッド	`# かつ訓練時である場合、...`	`# かつ訓練時でない場合、...`	3刷	全て
9.3.2節: `_async_batch_run_chatgpt`関数、`batch_run_chatgpt`関数	`max_tokens: int`, `stop: str \| list[str]`	`max_tokens: int \| None`, `stop: str \| list[str] \| None`	3刷	全て
参考文献	日本語表記の名前の苗字と名前が逆に表記されている	苗字と名前を正しい順序で表記する	3刷	全て

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

errata

「大規模言語モデル入門」正誤表

Clone this wiki locally