+ | patient_id | +drugName | +condition | +review | +rating | +date | +usefulCount | +review_length | +
---|---|---|---|---|---|---|---|---|
0 | +95260 | +Guanfacine | +adhd | +"My son is halfway through his fourth week of Intuniv..." | +8.0 | +April 27, 2010 | +192 | +141 | +
1 | +92703 | +Lybrel | +birth control | +"I used to take another oral contraceptive, which had 21 pill cycle, and was very happy- very light periods, max 5 days, no other side effects..." | +5.0 | +December 14, 2009 | +17 | +134 | +
2 | +138000 | +Ortho Evra | +birth control | +"This is my first time using any form of birth control..." | +8.0 | +November 3, 2015 | +10 | +89 | +
+ | condition | +frequency | +
---|---|---|
0 | +birth control | +27655 | +
1 | +depression | +8023 | +
2 | +acne | +5209 | +
3 | +anxiety | +4991 | +
4 | +pain | +4744 | +
+ | html_url | +title | +comments | +body | +
---|---|---|---|---|
0 | +https://github.com/huggingface/datasets/issues/2787 | +ConnectionError: Couldn't reach https://raw.githubusercontent.com | +the bug code locate in :\r\n if data_args.task_name is not None... | +Hello,\r\nI am trying to run run_glue.py and it gives me this error... | +
1 | +https://github.com/huggingface/datasets/issues/2787 | +ConnectionError: Couldn't reach https://raw.githubusercontent.com | +Hi @jinec,\r\n\r\nFrom time to time we get this kind of `ConnectionError` coming from the github.com website: https://raw.githubusercontent.com... | +Hello,\r\nI am trying to run run_glue.py and it gives me this error... | +
2 | +https://github.com/huggingface/datasets/issues/2787 | +ConnectionError: Couldn't reach https://raw.githubusercontent.com | +cannot connect,even by Web browser,please check that there is some problems。 | +Hello,\r\nI am trying to run run_glue.py and it gives me this error... | +
3 | +https://github.com/huggingface/datasets/issues/2787 | +ConnectionError: Couldn't reach https://raw.githubusercontent.com | +I can access https://raw.githubusercontent.com/huggingface/datasets/1.7.0/datasets/glue/glue.py without problem... | +Hello,\r\nI am trying to run run_glue.py and it gives me this error... | +
load_dataset()
para cargar datasets locales.",
+ correct: true
+ },
+ {
+ text: "El Hub de Hugging Face",
+ explain: "¡Correcto! Puedes cargar datasets del Hub pasando el ID del dataset, e.g. load_dataset('emotion')
.",
+ correct: true
+ },
+ {
+ text: "Un servidor remoto",
+ explain: "¡Correcto! Puedes pasar URL al argumento data_files
de la función load_dataset()
psara cargar archivos remotos.",
+ correct: true
+ },
+ ]}
+/>
+
+### 2. Supón que cargas una de las tareas de GLUE así:
+
+```py
+from datasets import load_dataset
+
+dataset = load_dataset("glue", "mrpc", split="train")
+```
+
+¿Cuál de los sigientes comandos a a producir una muestra aleatoria de 50 elementos de `dataset`?
+
+Dataset.sample()
."
+ },
+ {
+ text: "dataset.shuffle().select(range(50))
",
+ explain: "¡Correcto! Como viste en el capítulo, primero tienes que ordenar aleatoriamente el dataset y luego seleccionar las muestras.",
+ correct: true
+ },
+ {
+ text: "dataset.select(range(50)).shuffle()
",
+ explain: "Esto es incorrecto. Si bien el código se va a ejecutar, sólo va a ordenar aleatoriamente los primeros 50 elementos del dataset."
+ }
+ ]}
+/>
+
+### 3. Supón que tienes un dataset sobre mascotas llamado `pets_dataset`, que tiene una columna `name` que contiene el nombre de cada mascota. ¿Cuál de los siguientes acercamientos te permitiría filtrar el dataset para todas las mascotas cuyos nombres comienzan con la letra "L"?
+
+pets_dataset.filter(lambda x['name'].startswith('L'))
",
+ explain: "Esto es incorrecrto. Una función lambda toma la forma general lambda *arguments* : *expression*
, así que tienes que definir los argumentos en este caso."
+ },
+ {
+ text: "Crear una funcióin como def filter_names(x): return x['name'].startswith('L')
y ejecutar pets_dataset.filter(filter_names)
.",
+ explain: "¡Correcto! Justo como con Dataset.map()
, puedes pasar funciones explícitas a Dataset.filter()
. Esto es útil cuando tienes una lógica compleja que no es adecuada para una función lambda. ¿Cuál de las otras soluciones podría funcionar?",
+ correct: true
+ }
+ ]}
+/>
+
+### 4. ¿Qué es la proyección en memoria (_memory mapping_)?
+
+IterableDataset
es un generador, no un contenedor, así que deberías acceder a sus elementos usando next(iter(dataset))
.",
+ correct: true
+ },
+ {
+ text: "El dataset allocine
no tiene un conjunto train
.",
+ explain: "Incorrecto. Revisa la [tarjeta del dataset allocine
](https://huggingface.co/datasets/allocine) en el Hub para ver qué conjuntos contiene."
+ }
+ ]}
+/>
+
+### 7. ¿Cuáles son los principales beneficiones de crear una tarjeta para un dataset?
+
+text-generation
パイプラインを用いたときの動作です。"
+ },
+ {
+ text: "この文中の人物、団体、場所を表す単語を返します。",
+ explain: "さらに、grouped_entities=True
を用いると、同じエンティティに属する単語をグループ化します。",
+ correct: true
+ }
+ ]}
+/>
+
+### 3. このサンプルコードでは...をどのように置き換えればよいでしょうか?
+
+```py
+from transformers import pipeline
+
+filler = pipeline("fill-mask", model="bert-base-cased")
+result = filler("...")
+```
+
+bert-base-cased
のモデルカードをチェックして、あなたの間違いを見つけましょう。"
+ },
+ {
+ text: "This [MASK] has been waiting for you.",
+ explain: "正解!このモデルのマスクトークンは[MASK]です。",
+ correct: true
+ },
+ {
+ text: "This man has been waiting for you.",
+ explain: "間違いです。このパイプラインはマスクされた単語を埋めるので、どこかにマスクトークンが必要です。"
+ }
+ ]}
+/>
+
+### 4. なぜこのコードは動かないのでしょうか?
+
+```py
+from transformers import pipeline
+
+classifier = pipeline("zero-shot-classification")
+result = classifier("This is a course about the Transformers library")
+```
+
+