+ | patient_id | +drugName | +condition | +review | +rating | +date | +usefulCount | +review_length | +
---|---|---|---|---|---|---|---|---|
0 | +95260 | +Guanfacine | +adhd | +"My son is halfway through his fourth week of Intuniv..." | +8.0 | +April 27, 2010 | +192 | +141 | +
1 | +92703 | +Lybrel | +birth control | +"I used to take another oral contraceptive, which had 21 pill cycle, and was very happy- very light periods, max 5 days, no other side effects..." | +5.0 | +December 14, 2009 | +17 | +134 | +
2 | +138000 | +Ortho Evra | +birth control | +"This is my first time using any form of birth control..." | +8.0 | +November 3, 2015 | +10 | +89 | +
+ | condition | +frequency | +
---|---|---|
0 | +birth control | +27655 | +
1 | +depression | +8023 | +
2 | +acne | +5209 | +
3 | +anxiety | +4991 | +
4 | +pain | +4744 | +
+ | html_url | +title | +comments | +body | +
---|---|---|---|---|
0 | +https://github.com/huggingface/datasets/issues/2787 | +ConnectionError: Couldn't reach https://raw.githubusercontent.com | +the bug code locate in :\r\n if data_args.task_name is not None... | +Hello,\r\nI am trying to run run_glue.py and it gives me this error... | +
1 | +https://github.com/huggingface/datasets/issues/2787 | +ConnectionError: Couldn't reach https://raw.githubusercontent.com | +Hi @jinec,\r\n\r\nFrom time to time we get this kind of `ConnectionError` coming from the github.com website: https://raw.githubusercontent.com... | +Hello,\r\nI am trying to run run_glue.py and it gives me this error... | +
2 | +https://github.com/huggingface/datasets/issues/2787 | +ConnectionError: Couldn't reach https://raw.githubusercontent.com | +cannot connect,even by Web browser,please check that there is some problems。 | +Hello,\r\nI am trying to run run_glue.py and it gives me this error... | +
3 | +https://github.com/huggingface/datasets/issues/2787 | +ConnectionError: Couldn't reach https://raw.githubusercontent.com | +I can access https://raw.githubusercontent.com/huggingface/datasets/1.7.0/datasets/glue/glue.py without problem... | +Hello,\r\nI am trying to run run_glue.py and it gives me this error... | +
load_dataset()
per caricare dataset locali.",
+ correct: true
+ },
+ {
+ text: "L'Hub Hugging Face.",
+ explain: "Corretto! Puoi caricare i dataset presenti sull'Hub fornendo l'ID del dataset, ad esempio load_dataset('emotion')
.",
+ correct: true
+ },
+ {
+ text: "Un server remoto",
+ explain: "Corretto! Puoi passare un URL nell'argomento data_files
di load_dataset()
per caricare file in remoto.",
+ correct: true
+ },
+ ]}
+/>
+
+### 2. Immagina di caricare uno dei task GLUE come segue:
+
+```py
+from datasets import load_dataset
+
+dataset = load_dataset("glue", "mrpc", split="train")
+```
+
+Quale dei comandi seguenti produce un campione di 50 elementi casuali da `dataset`?
+
+Dataset.sample()
."
+ },
+ {
+ text: "dataset.shuffle().select(range(50))
",
+ explain: "Corretto! Come hai visto in questo capitolo, puoi mescolare il dataset e selezionarne i campioni.",
+ correct: true
+ },
+ {
+ text: "dataset.select(range(50)).shuffle()
",
+ explain: "Questa risposta è sbagliata -- anche se il codice verrebbe eseguito, mescolerebbe solo i primi 50 elementi del dataset"
+ }
+ ]}
+/>
+
+### 3. Immagina di avere un dataset sugli animali domestici, chiamto `pets_dataset`, che ha una colonna `name` che denota il nome di ogni animale. Quale degli approcci ci permetterebbe di filtrare il dataset e lasciare solo gli animali il cui nome inizia con la lettera "L"?
+pets_dataset.filter(lambda x['name'].startswith('L'))
",
+ explain: "Questa risposta è sbagliata: una funzione lambda ha la forma generica lambda *argomenti* : *espressione*
, per cui devi esplicitare gli argomenti in questo caso."
+ },
+ {
+ text: "Creare una funzione come def filter_names(x): return x['name'].startswith('L')
ed eseguire pets_dataset.filter(filter_names)
.",
+ explain: "Corretto! Proprio come Dataset.map()
, puoi passare delle funzioni esplicite a Dataset.filter()
. Quest'opzione è utile quando hai un'espressione complessa che non è adatta a una funzione lambda. Quale altra soluzione potrebbe funzionare?",
+ correct: true
+ }
+ ]}
+/>
+
+### 4. Cos'è il memory mapping?
+
+IterableDataset
è un generatore e non un contenitore, per cui puoi accedere ai suoi elementi solo usando next(iter(dataset))
.",
+ correct: true
+ },
+ {
+ text: "Il dataset allocine
non ha una sezione train
.",
+ explain: "Questa risposta è sbagliata -- controlla le [informazioni sul dataset allocine
](https://huggingface.co/datasets/allocine) sull'Hub per vedere quali sezioni contiente."
+ }
+ ]}
+/>
+
+### 7. Quali dei seguenti sono i vantaggi principali di creare una dataset card?
+
+