Это приложение для Linux под названием Question Answering Corpus, последнюю версию которого можно скачать в формате rc-datasourcecode.tar.gz. Его можно запустить онлайн на бесплатном хостинг-провайдере OnWorks для рабочих станций.
Бесплатно скачайте и запустите онлайн это приложение под названием Question Answering Corpus с OnWorks.
Следуйте этим инструкциям, чтобы запустить это приложение:
- 1. Загрузил это приложение на свой компьютер.
- 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 3. Загрузите это приложение в такой файловый менеджер.
- 4. Запустите онлайн-эмулятор OnWorks Linux или Windows или онлайн-эмулятор MACOS с этого веб-сайта.
- 5. В только что запущенной ОС OnWorks Linux перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 6. Скачайте приложение, установите его и запустите.
СКРИНШОТЫ:
Корпус вопросов и ответов
ОПИСАНИЕ:
RC-Data — это фреймворк для генерации наборов данных, созданный Google DeepMind для создания больших пар вопрос-ответ для понимания прочитанного из новостных статей CNN и Daily Mail. Этот набор данных, представленный в статье 2015 года «Обучение машин чтению и пониманию» (Hermann et al., NIPS 2015), был одним из первых крупных корпусов, предназначенных для обучения и оценки моделей машинного чтения и понимания. Репозиторий предоставляет скрипты для загрузки архивных статей CNN и Daily Mail из Wayback Machine и автоматической генерации вопросов в стиле «клоуз», где сущности в тексте заменяются плейсхолдерами. Каждый экземпляр данных состоит из новостной статьи (контекста), сгенерированного вопроса и соответствующего ему ответа, что делает его пригодным для контролируемых систем машинного обучения. Вывод следует стандартизированному формату вопрос-ответ с сопоставлениями сущностей, помогающими моделям разрешать именованные ссылки.
Особенности
- Генерирует большие наборы данных «вопрос-ответ» из новостных статей
- Включает данные из CNN и Daily Mail через Wayback Machine.
- Создает вопросы, контексты и ответы в стандартизированном текстовом формате.
- Поддерживает анонимизацию сущностей посредством сопоставления для обучения модели
- Предлагает воспроизводимый конвейер генерации с использованием скриптов Python
- Совместимо с задачами машинного понимания и сравнительного анализа обработки естественного языка
Язык программирования
Питон
Категории
Это приложение также можно скачать по адресу https://sourceforge.net/projects/question-answer-corpus.mirror/. Оно размещено на платформе OnWorks для максимально удобного запуска онлайн через одну из наших бесплатных операционных систем.