این مجموعه که ماشین خواندن و درک مفاهیم مایکروسافت یا MS MARCO نام داشته میتواند برای آموزش سیستمهای هوش مصنوعی در جهت تشخیص سوالهای مختلف و پاسخ به آنها و در نهایت برای ایجاد سیستمهایی استفاده شود که پاسخهای منحصر به فردی را به سوالاتی که قبلا چیزی در مورد آن نشنیدهاند میدهند.
محققان بر این باورند که با ارائه سوالات و پاسخهای واقع بینانه میتوانند سیستمها را برای درک بهتر تفاوتهای ظریف و پیچیده سوالاتی که مردم به طور معمول میپرسند آموزش دهند.
محققان این پژوهش از مرکز فناوری یادگیری عمیق مایکروسافت اظهار کردند: مجموعه دادههای ما نه تنها با استفاده از دادههای دنیای واقعی طراحی شده بلکه محدودیتها را از بین برده به طوری که مدلهای یادگیری عمیق نسل جدید میتواند دادهها را قبل از پاسخ به سوالات درک کنند.
مایکروسافت اعلام کرد که مجموعه دادههای MS MARCO در حال حاضر برای هر محققی که میخواهد آن را دانلود کرده و برای کاربردهای غیر تجاری از آن استفاده کند به صورت رایگان در دسترس است.