Загрузка корпуса вопросов и ответов для Linux

Это приложение для Linux под названием Question Answering Corpus, последнюю версию которого можно скачать в формате rc-datasourcecode.tar.gz. Его можно запустить онлайн на бесплатном хостинг-провайдере OnWorks для рабочих станций.

 
 

Бесплатно скачайте и запустите онлайн это приложение под названием Question Answering Corpus с OnWorks.

Следуйте этим инструкциям, чтобы запустить это приложение:

- 1. Загрузил это приложение на свой компьютер.

- 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.

- 3. Загрузите это приложение в такой файловый менеджер.

- 4. Запустите онлайн-эмулятор OnWorks Linux или Windows или онлайн-эмулятор MACOS с этого веб-сайта.

- 5. В только что запущенной ОС OnWorks Linux перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.

- 6. Скачайте приложение, установите его и запустите.

СКРИНШОТЫ:


Корпус вопросов и ответов


ОПИСАНИЕ:

RC-Data — это фреймворк для генерации наборов данных, созданный Google DeepMind для создания больших пар вопрос-ответ для понимания прочитанного из новостных статей CNN и Daily Mail. Этот набор данных, представленный в статье 2015 года «Обучение машин чтению и пониманию» (Hermann et al., NIPS 2015), был одним из первых крупных корпусов, предназначенных для обучения и оценки моделей машинного чтения и понимания. Репозиторий предоставляет скрипты для загрузки архивных статей CNN и Daily Mail из Wayback Machine и автоматической генерации вопросов в стиле «клоуз», где сущности в тексте заменяются плейсхолдерами. Каждый экземпляр данных состоит из новостной статьи (контекста), сгенерированного вопроса и соответствующего ему ответа, что делает его пригодным для контролируемых систем машинного обучения. Вывод следует стандартизированному формату вопрос-ответ с сопоставлениями сущностей, помогающими моделям разрешать именованные ссылки.



Особенности

  • Генерирует большие наборы данных «вопрос-ответ» из новостных статей
  • Включает данные из CNN и Daily Mail через Wayback Machine.
  • Создает вопросы, контексты и ответы в стандартизированном текстовом формате.
  • Поддерживает анонимизацию сущностей посредством сопоставления для обучения модели
  • Предлагает воспроизводимый конвейер генерации с использованием скриптов Python
  • Совместимо с задачами машинного понимания и сравнительного анализа обработки естественного языка


Язык программирования

Питон


Категории

Библиотеки

Это приложение также можно скачать по адресу https://sourceforge.net/projects/question-answer-corpus.mirror/. Оно размещено на платформе OnWorks для максимально удобного запуска онлайн через одну из наших бесплатных операционных систем.



Новейшие онлайн-программы для Linux и Windows


Категории для загрузки Программное обеспечение и программы для Windows и Linux