Descargar el corpus de preguntas y respuestas para Linux

Esta es la aplicación para Linux llamada Question Answering Corpus, cuya última versión se puede descargar como rc-datasourcecode.tar.gz. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.

 
 

Descargue y ejecute en línea esta aplicación llamada Question Answering Corpus con OnWorks de forma gratuita.

Siga estas instrucciones para ejecutar esta aplicación:

- 1. Descargue esta aplicación en su PC.

- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.

- 3. Cargue esta aplicación en dicho administrador de archivos.

- 4. Inicie el emulador en línea OnWorks Linux o Windows en línea o el emulador en línea MACOS desde este sitio web.

- 5. Desde el SO OnWorks Linux que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.

- 6. Descarga la aplicación, instálala y ejecútala.

CAPTURAS DE PANTALLA:


Corpus de preguntas y respuestas


DESCRIPCIÓN:

RC-Data es un marco de generación de conjuntos de datos creado por Google DeepMind para producir pares de preguntas y respuestas de comprensión lectora a gran escala a partir de artículos de noticias de CNN y Daily Mail. El conjunto de datos, presentado en el artículo de 2015 "Teaching Machines to Read and Comprehend" (Hermann et al., NIPS 2015), fue uno de los primeros grandes corpus diseñados para entrenar y evaluar modelos de lectura y comprensión de máquinas. El repositorio proporciona scripts para descargar artículos archivados de CNN y Daily Mail de Wayback Machine y generar automáticamente preguntas de estilo cloze donde las entidades en el texto se reemplazan con marcadores de posición. Cada instancia de datos consta de un artículo de noticias (contexto), una pregunta generada y su respuesta correspondiente, lo que la hace adecuada para configuraciones de aprendizaje automático supervisado. El resultado sigue un formato estandarizado de pregunta-respuesta, con asignaciones de entidades para ayudar a los modelos a resolver referencias con nombre.



Caracteristicas

  • Genera conjuntos de datos de preguntas y respuestas a gran escala a partir de artículos de noticias.
  • Incluye datos de CNN y Daily Mail corpus a través de Wayback Machine.
  • Produce preguntas, contextos y respuestas en un formato de texto estandarizado.
  • Admite la anonimización de entidades a través del mapeo para el entrenamiento de modelos
  • Ofrece una canalización de generación reproducible mediante scripts de Python
  • Compatible con comprensión de máquinas y tareas de evaluación comparativa de PNL


Lenguaje de programación

Python


Categorías

Bibliotecas

Esta aplicación también se puede obtener de https://sourceforge.net/projects/question-answer-corpus.mirror/. Está alojada en OnWorks para facilitar su ejecución en línea desde uno de nuestros sistemas operativos gratuitos.



Últimos programas en línea de Linux y Windows


Categorías para descargar Software y Programas para Windows y Linux