این یک برنامه لینوکس به نام Question Answering Corpus است که آخرین نسخه آن را میتوانید با نام rc-datasourcecode.tar.gz دانلود کنید. این برنامه را میتوان به صورت آنلاین در ارائه دهنده خدمات میزبانی رایگان OnWorks برای ایستگاههای کاری اجرا کرد.
این برنامه با نام Question Answering Corpus with OnWorks را به صورت رایگان دانلود و اجرا کنید.
برای اجرای این برنامه این دستورالعمل ها را دنبال کنید:
- 1. این برنامه را در رایانه شخصی خود دانلود کنید.
- 2. در فایل منیجر ما https://www.onworks.net/myfiles.php?username=XXXXX نام کاربری مورد نظر خود را وارد کنید.
- 3. این برنامه را در چنین فایل منیجر آپلود کنید.
- 4. OnWorks Linux آنلاین یا شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MACOS را از این وب سایت راه اندازی کنید.
- 5. از سیستم عامل لینوکس OnWorks که به تازگی راه اندازی کرده اید، به مدیر فایل ما https://www.onworks.net/myfiles.php?username=XXXXX با نام کاربری که می خواهید بروید.
- 6. اپلیکیشن را دانلود کرده، نصب و اجرا کنید.
اسکرین شات ها:
مجموعه پرسش و پاسخ
DESCRIPTION:
RC-Data یک چارچوب تولید مجموعه داده است که توسط Google DeepMind برای تولید جفتهای پرسش و پاسخ درک مطلب در مقیاس بزرگ از مقالات خبری CNN و Daily Mail ایجاد شده است. این مجموعه داده که در مقاله سال ۲۰۱۵ با عنوان «آموزش خواندن و درک مطلب به ماشینها» (Hermann et al., NIPS 2015) معرفی شد، از اولین پیکرههای بزرگ طراحی شده برای آموزش و ارزیابی مدلهای خواندن و درک مطلب ماشینی بود. این مخزن اسکریپتهایی را برای دانلود مقالات بایگانی شده CNN و Daily Mail از Wayback Machine و تولید خودکار سوالات به سبک cloze ارائه میدهد که در آن موجودیتهای موجود در متن با متغیرهایی جایگزین میشوند. هر نمونه داده شامل یک مقاله خبری (زمینه)، یک سوال تولید شده و پاسخ مربوطه آن است که آن را برای تنظیمات یادگیری ماشین تحت نظارت مناسب میکند. خروجی از یک قالب پرسش و پاسخ استاندارد پیروی میکند، با نگاشتهای موجودیت برای کمک به مدلها در حل ارجاعات نامگذاری شده.
امکانات
- مجموعه دادههای پرسش و پاسخ در مقیاس بزرگ را از مقالات خبری تولید میکند.
- شامل دادههایی از شرکتهای CNN و Daily Mail از طریق Wayback Machine
- سوالات، زمینهها و پاسخها را در قالب متنی استاندارد تولید میکند.
- از ناشناسسازی موجودیتها از طریق نگاشت برای آموزش مدل پشتیبانی میکند.
- با استفاده از اسکریپتهای پایتون، یک خط تولید قابل تکرار ارائه میدهد.
- سازگار با وظایف سنجش درک ماشین و NLP
زبان برنامه نویسی
پــایتــون
دسته بندی ها
این برنامهای است که میتوان آن را از https://sourceforge.net/projects/question-answer-corpus.mirror/ نیز دریافت کرد. این برنامه در OnWorks میزبانی شده است تا بتوان آن را به سادهترین روش از یکی از سیستمهای عامل رایگان ما به صورت آنلاین اجرا کرد.