NLP Course documentation

Quiz de final de capítulo

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

Quiz de final de capítulo

Ask a Question

¡Vimos muchas cosas en este capítulo! No te preocupes si no te quedaron claros todos los detalles; los siguientes capítulos te ayudarán a entender cómo funcionan las cosas internamente.

Antes de seguir, probemos lo que aprendiste en este capítulo:

1. ¿Desde qué ubicaciones te permite cargar datasets la función load_dataset() en 🤗 Datasets?

2. Supón que cargas una de las tareas de GLUE así:

from datasets import load_dataset

dataset = load_dataset("glue", "mrpc", split="train")

¿Cuál de los siguientes comandos a a producir una muestra aleatoria de 50 elementos de dataset?

3. Supón que tienes un dataset sobre mascotas llamado pets_dataset , que tiene una columna name que contiene el nombre de cada mascota. ¿Cuál de los siguientes acercamientos te permitiría filtrar el dataset para todas las mascotas cuyos nombres comienzan con la letra “L”?

4. ¿Qué es la proyección en memoria ( memory mapping )?

5. ¿Cuáles son los principales beneficios de la proyección en memoria?

6. ¿Por qué no funciona el siguiente código?

from datasets import load_dataset

dataset = load_dataset("allocine", streaming=True, split="train")
dataset[0]

7. ¿Cuáles son los principales beneficios de crear una tarjeta para un dataset?

8. ¿Qué es la búsqueda semántica?

9. Para la búsqueda semántica asimétrica, usualmente tienes:

10. ¿Puedo usar 🤗 Datasets para cargar datos y usarlos en otras áreas, como procesamiento de habla?

< > Update on GitHub