ماهان شبکه ایرانیان

افزایش توان موتور جستجوی نرم افزارهای نور

در شماره های پیشین در راستای اصلاح و ارتقای موتور جستجوی نور در نرم افزارهای جدید نور، طراحی و پیاده سازی موتور جستجوی نادقیق و نیز طراحی و ایجاد موتور جستجوی حروف مبهم (وایلد کارد) به تفصیل توضیح داده شدند

واحد جستجو، جستجو در فهرست، جستجوهای همزمان

بخش چهارم

اشاره

در شماره های پیشین در راستای اصلاح و ارتقای موتور جستجوی نور در نرم افزارهای جدید نور، طراحی و پیاده سازی موتور جستجوی نادقیق و نیز طراحی و ایجاد موتور جستجوی حروف مبهم (وایلد کارد) به تفصیل توضیح داده شدند. نقاط ضعف ابزار جستجوی حروف مبهم در پایگاههای اطلاعاتی استاندارد بررسی گردید و شیوه ابداعی موتور جستجوی نور در مورد حروف مبهم تبیین شد. در این شماره اصلاحات ساختاری دیگر در مورد تغییر واحد جستجو از فیزیکی به منطقی، و ارائه پاسخ اجمالی، امکان جستجو در فهرست و عرضه محیطهای جستجوی همزمان شرح داده می شوند .

6 تغییر واحد فیزیکی جستجو به واحد منطقی

در برنامه های پیشین نور همواره واحد نمایش (1) و واحد جستجو، صفحه فیزیکی کتاب بود. تنها در برنامه قرآن و عروة الوثقی واحدهای منطقی، ملاک واحد جستجو بود. اما در برنامه های جدید نور، همیشه واحد جستجو نقش کاملا منطقی و مفهومی دارد. در بسیاری از کتابها مانند کتابهای لغت، یا تاریخ یا فلسفه، همان پاراگراف های خود کتاب ملاک هستند؛ یعنی علامتهای نقطه ای که بعد از آنها خط جدیدی گشوده شده است جدا کننده، پاراگراف ها می باشند.

61) تعریف واحد منطقی:

در قرآن واحد منطقی همان آیه است. در کتابی مانند عروة الوثقی مسئله فقهی، واحد جستجو و نمایش قرار می گیرد. در کتابهای حدیثی مانند جامع احادیث نور (2) واحد منطقی خود روایت است. در بعضی از روایات جامع احادیث نور (2) که روایت طولانی می شود و تا 50 صفحه هم می رسد (مانند توحید مفضل) ، روایت توسط ماشین تقطیع می شود و هر دو صفحه به شرط اینکه از 700 کلمه تجاوز نکند یک واحد منطقی محسوب می گردد.

در مجموعه های اشعار سعی شده است از ابتدای شعر تا انتهای آن یک واحد محسوب شود. البته در مجموعه های شعری بسیار طولانی، همان قانون حاکم است. اگر چه ما به خاطر محدودیت زدن سرصفحه در میان شعر، در صورتی که اگر بخواهیم در ابتدای هر صفحه فیش صفحه بخورد، باید شعر هر صفحه را به طور مستقل یک واحد به حساب بیاوریم. دلیل این محدودیت محاسبات دقیق و پیچیده ای است که موتور نمایش شعر از ابتدا تا انتهای شعر روی مصرعها و طول فیزیکی آنها انجام می دهد تا اشعار کاملا مصرع به مصرع در هر بیت، به طور جفت جفت زیر هم بیفتند .

62) دلیل انتخاب واحد منطقی:

نکته عدول از واحد فیزیکی صفحه به واحد منطقی پاراگراف با تعریف خاصی که از پاراگراف عرضه کردیم، این بود که آنچه که به عنوان واحد جستجو انتخاب می شود، محدوده های در نظر گرفتن عبارت، و نیز جستجوی کلمات به صورت ترکیب عطفی و دیگر عملگرهای منطقی جستجو، در آن ناحیه محاسبه شود. هر چه این واحد با معنی تر و به مقصود پژوهشگر نزدیک تر باشد، جستجوهای ترکیبی وی معنا و مفهوم بهتری پیدا می کند و از دیدگاه پژوهشی، کاربردی تر و کارآمد می گردد.

7 ارائه پاسخ اجمالی پس از جستجو:

یکی از ویژگیهایی که در برنامه های قدیم نور وجود داشت اما در برنامه تحت ویندوز نور از آن خبری نبود، قابلیت نمایش پاسخهای اجمالی است. مقصود از پاسخ اجمالی ارائه قسمت کوتاهی از پاسخ است که حاوی کلمه یا عبارت مورد جستجو باشد. با دقت در برنامه بحار قدیم می توان دید که پس از جستجوی کلمه، پنج کلمه قبل از پاسخ و پنج کلمه بعد از آن به عنوان پاسخ اجمالی آورده می شود. کلمه جواب، به رنگ خاصی در می آید تا بیشتر جلب توجه کند؛ قطعه ای که به دست می آید چه بسا کاملا بی معنی و نامفهوم باشد. در این حالت اگر کاربر مایل بود، به پاسخ تفصیلی مراجعه می کرد، که آن هم معمولا از ابتدای حدیث نمایش می داد و تنها در موضع جواب که ممکن بود چند صفحه بعد باشد، رنگی می شد.

در نور العترة (1) (مصادر بحار الانوار) تلاش به عمل آمد تا این قطعه پاسخ اجمالی معنی دارتر شود به این ترتیب که چند کلمه از ابتدای روایت آورده می شد و سپس با با درج علامت سه نقطه ". . . " (به نشانه انتخاب تنها بخشی از مطلب که مرتبط با مورد جستجو است) مقداری حول و حوش کلمات پاسخ و بعد مجددا گذاشتن سه نقطه ". . . " و در انتها چند کلمه آخر روایت می آمد. این روش به جای اینکه ابهام پاسخ اجمالی را کمتر کند، به پیچیدگی و گیج کنندگی آن صد چندان افزود.

در برنامه بحار قدیم، هنگامی که جستجوی ترکیبی یا عبارتی در کار بود، تفاوتی میان پاسخ اجمالی یا تفصیلی در بین نبود. در برنامه مصادر بحار نیز پاسخ اجمالی بسیار مبهمی همراه با علامت ". . . " ارائه می شد. تصمیم گرفته شد که متد بهتر و کارآتری برای پاسخ اجمالی و تفصیلی در نظر گرفته شود تا نقیصه ای که در برنامه های تحت ویندوز مرکز از سال 75 تا 77 مشاهده می شد برطرف گردد. لذا نخستین بار در برنامه "قاموس النور" و به دنبال آن تمامی برنامه های بعدی مانند جامع احادیث نور (2) ارائه پاسخ اجمالی و تفکیک آن از تفصیلی، در دستور کار قرار گرفت.

71) تعریف پاسخ اجمالی در برنامه های جدید نور:

مقصود از پاسخ اجمالی، پاسخی است که حد اکثر در یک سطر نمایش داده می شود و دارای دو ویژگی است: اولا مشتمل بر نشانی پاراگراف حاوی جواب مورد نظر است و ثانیا نزدیک ترین عنوان فصل یا بابی که پاراگراف مشتمل بر جواب در تحت آن واقع شده است بعد از نشانی نمایش داده می شود. نزدیک ترین عنوان باب در «قاموس النور» که مشتمل بر کتابهای لغت است، همان مدخل ها و ریشه ها هستند، اما در «جامع احادیث نور (2) » همان ابواب و فصولی است که به صورت چند سطحی در کتب حدیثی آورده شده است و چون معمولا عنوان باب در این کتاب طولانی است، بخشی از آن در جواب اجمالی می آید و با درج سه نقطه ". . . " اشاره می شود که این عنوان فصل یا باب ناقص است.

با سطری کردن پاسخها ولو در جستجوی عبارتی و ترکیبی تعداد پاسخهای بیشتری به یک باره در معرض دید کاربر قرار می گیرد. مثلا در برنامه قاموس النور با جستجوی یک واژه، در ابتدا به او گفته می شود که در چه آدرس هایی و در ذیل چه مدخل هایی کلمه مورد نظر وجود دارد. ممکن است اعتراض کنید که در این تعریف از پاسخ اجمالی، از موضع پاسخ و خلاصه کردن متن شامل جواب خبری نیست. ما پاسخ این اعتراض را در دو بند بعدی ذکر می کنیم.

72) ارائه کلمه یا عبارت مورد جستجو در معرض دید کاربر:

در نمایش پاسخ تفصیلی می توان جایگاه شروع جواب را همیشه در سطر اول یا دوم یا بالاتر قرار داد؛ یعنی همیشه پاسخ درخواستی کاربر در معرض دید او قرار گیرد و کاربر ملزم نیست که در پاسخ تفصیلی؛ آغاز پاراگراف جواب را مشاهده نماید.

کاربر برنامه نویس با توجه به درخواست کارفرما می تواند تنظیم کند که قسمت رنگی پاسخهای جستجو در چه شماره سطری از نمایش قرار داشته باشد. علاوه بر آن می تواند شماره سطر را به صورت انتخابی در اختیار کاربر نهایی قرار دهد. همچنین ممکن است اصلا سطر خاصی را در نظر نداشته باشد بلکه بخواهد متن رنگی شده همیشه در صحنه نمایش قرار گرفته باشد و از دید کاربر پنهان نباشد. موتور نمایش پاسخ، تمامی این قابلیتها را داراست. در برنامه «قاموس النور» از متد دوم استفاده شده است و در برنامه «جامع احادیث نور (2) » از متد نخست، یعنی پاسخ رنگی همواره در سطر دوم قرار گرفته است.

با آنچه که توضیح آن در بند بعد می آید، مقصود ما از پاسخ اجمالی کامل می گردد.

73) ارتباط دو سویه میان پاسخ اجمالی و تفصیلی:

غرض اولیه از ارائه پاسخ اجمالی، دسترسی سریع تر کاربر به مواضع پاسخ در ضمن متن می باشد . از یک طرف با عرضه جواب اجمالی با تعریفی که ارائه شد در یک سطر، پاسخهای متعددی را در یک صفحه در اختیار کاربر قرار می دهیم و از طرف دیگر با در معرض دید گذاشتن پاسخ رنگی در جواب تفصیلی، ارتباط با پاسخ اجمالی فراهم می شود. (حلقه مفقوده ای که کارآیی نمایش پاسخها را صد چندان افزون می نماید همین ارتباط دو سویه پاسخ اجمالی و تفصیلی است. ) صحنه ارتباط دو سویه یا در صفحه دوم پاسخها می آید چنانکه در برنامه «قاموس النور» چنین است و یا اینکه در همان صفحه اول نمایش پاسخ اجمالی می آید همان گونه که در «کتابخانه اصول» و «جامع احادیث نور (2) » آمده است نحوه ارتباط پاسخ اجمالی با تفصیلی به این شکل است که با راه رفتن روی فهرست پاسخهای اجمالی، پاسخ تفصیلی مربوط به آن به روز در آورده می شود و ناحیه رنگی شده کلمه در معرض دید کاربر قرار می گیرد . به این ترتیب مشکل سر در گم شدن و گیج شدن کاربر که هنگام تبدیل اجمالی به تفصیلی در برنامه های پیشین نور پیش می آمد برطرف شده است.

از طرف دیگر با حرکت روی پاسخ تفصیلی نیز پاسخ اجمالی به روز در آورده می شود و این از چند جهت مفید است؛ هم کاربر می تواند روی هر پاسخ نشانی آن را ببیند و هم اینکه اگر ناحیه پاسخ تفصیلی خود را مطلوب تشخیص نداد بلافاصله روی پاسخ اجمالی در ناحیه مطلوب خود سویچ می کند. بنا بر این نوار پیمایش در پنجره پاسخ اجمالی و پنجره پاسخ تفصیلی، ارتباط یک به یک و دو سویه دارند.

74) امکان بزرگ نمایی پاسخ اجمالی تفصیلی:

در صفحه اصلی جستجو که فهرست ها و ارتباط آنها با صفحه کلید و خط ورودی جستجو و عملگرها وجود دارد، جا و فضای کمی برای نمایش پاسخهای اجمالی و تفصیلی وجود دارد، کلیدی در صحنه تعبیه شده است که می توان به وسیله آن، صحنه را به صورت کامل در اختیار نمایش پاسخ اجمالی و تفصیلی نهاد. گاه این بسط و گسترش صحنه پاسخ به صورت افقی است؛ همان طور که در «جامع احادیث نور (2) » و «کتابخانه اصول» چنین است: تفصیلی اجمالی این مسئله به خاطر این است که عناوین ابواب و فصول که بخشی از جواب اجمالی است، به صورت کامل تر نمایش داده شوند. اما در بعضی از موارد، مانند برنامه قاموس النور، صحنه پاسخها به صورت عمودی نشان داده: اجمالی تفصیلی و این به آن دلیل است که عناوین ابواب و فصول در کتاب لغت، چیزی جز عنوان مدخل و ریشه نیست و به فضای کمی از نظر سطری نیازمند است تا به صورت کامل نمایش داده شوند. در این مورد، تعداد پاسخهای اجمالی که یکجا در صحنه دیده می کند، زیادتر می باشد یعنی کاربر بیش از بیست پاسخ را یک جا مشاهده می نماید.

75) امکان انتخاب و گزینش دسته ای پاسخها:

امکان گزینش تمامی پاسخهای اجمالی به یک باره و یا تعدادی از آنها وجود دارد. کاربر می تواند تمام آدرس های گزینش شده خود را چاپ کند و یا به دفترچه یادداشت منتقل نماید . همین قابلیت در مورد نمایش تفصیلی نیز وجود دارد، با اینکه میان پاسخهای تفصیلی آدرس های آنها وجود ندارد و پاسخهای مزبور تنها با چند علامت * از هم جدا شده اند اما برنامه به طور اتوماتیک هنگامی که جوابهای گزینش شده را به دفترچه یادداشت یا چاپ منتقل می نماید، در ابتدای هر پاسخ تفصیلی، پاسخ اجمالی یعنی نشانی آن پاسخ تفصیلی و عنوان بابی که این پاسخ در ذیل آن آمده است را نیز منتقل می نماید.

76) ارتباط میان هر پاسخ و نمایش متن حاوی پاسخ:

همان طور که در توضیح قابلیتهای نمایش متن توضیح دادیم، ارتباط وثیقی میان پنجره پاسخها و نمایش متن وجود دارد. کاربر می تواند روی هر پاسخ، چه اجمالی و چه تفصیلی، کاربر را به پنجره متن حاوی آن پاسخ منتقل نماید تا کاربر بتواند در تمامی متن کتاب، پاراگراف های قبل و بعد از آن پاسخ را مشاهده نماید و اگر ابهامی در مطالعه پاسخ دارد، برطرف گردد . لازم به ذکر است که هنگام انتقال به متن، کنترل نمایش دقیقا به آن پاراگرافی منتقل می شود که پاسخ تفصیلی مورد نظر و انتخابی در آن وجود دارد.

در برنامه هایی مانند «کتابخانه اصول» امکان حاکم کردن همین پاسخ تفصیلی بر کارتابل نمایش متن نیز گذاشته شده است تا اگر کاربر خواست همین صحنه ای که هم اکنون در نمایش پاسخها می بیند بر کارتابل نمایش متن او نیز حاکم شود، بتواند چنین کاری را انجام دهد .

77) امکان علامت گذاری و حفظ جایگاه در پاسخهای تفصیلی:

همان طور که در مقاله های پیشین سیمای نرم افزارهای جدید نور گذشت «نمایش متن» از قابلیتهای جدید و پیشرفته تحقیقاتی برخوردار شده است. یکی از آن ویژگیها حفظ جایگاه و گذاشتن BookMark روی هر کلمه متن و امکان حرکت روی جایگاههای از پیش علامت گذاشته شده است . در پنجره پاسخهای تفصیلی نیز به صورت موقت چنین قابلیتی در دسترس کاربر می باشد. موقت بودن این علامت گذاری ها تا وقتی است که جستجوی جدیدی روی جستجوی فعلی انجام نشده باشد . اگر کاربری مایل است این علامت گذاری ها و نیز امکانات پیشرفته دیگر مانند «حاشیه نویسی (2) » ، « رنگی کردن متن (3) »و «نمایه زنی بر متن (4) »را نیز داشته باشد و داخل متن پاراگراف کتاب علامتهایش ذخیره شود باید از طریق ارتباط جستجو و متن، خود را به نمایش متن منتقل کند و آنگاه به ذخیره کردن علامت ها و یا سه ویژگی پیشرفته دیگر بپردازد.

8 امکان جستجوی مستقل در فهرستها و عناوین ابواب:

امکان جستجو در عناوین فهرست کتابها و عناوین فصول و ابواب، از جمله امکاناتی است که هیچ سابقه ای از پیش در برنامه های قبلی نور ندارد. تنها در برنامه های جدید شرکت حرف (شعبه اسلامی شرکت العالمیة یا صخر) مانند «جامع فقه اسلامی» این قابلیت گذاشته شده است. در برنامه های جدید نور نیز این ویژگی مهم و قابل توجه تعبیه شده است. شکل پیاده سازی این قابلیت به گونه ای است که بسیار پیشرفته تر از آن چیزی است که در برنامه های شرکت «حرف» وجود دارد. «جستجو در فهرست» در برنامه های جدید نور از جهت میانجی کاربر هیچ تفاوتی با محیط جستجوی معمولی در متن ندارد. از این رو، کاربر در موقع استفاده از آن دچار سردرگمی نمی شود. از این جهت در تمامی برنامه های جدید نور، در همان صفحه جستجو در کنار فهرست کلمات متن، فهرست کلمات ابواب و فصول نیز گذاشته شده است و تمامی عملگرهای ترکیب منطقی کلمات فهرست نیز در دسترس کاربر قرار دارد. همچنین وایلدکاردهای چندگانه ای در اختیار کاربر گذاشته شده است که در این جستجو نیز امکان ترکیب آنها با یکدیگر وجود دارد.

تفاوتی که این جستجو با جستجوی معمولی دارد، تنها در نمایش جواب تفصیلی است. در پاسخ تفصیلی به جای نمایش پاراگراف شامل کلمه مورد جستجو، بخشی از فهرست درختی کتابها (که رکوردی است که شامل این کلمه و یا شرط جستجوی ترکیبی) فعال می گردد. با حرکت روی پاسخهای اجمالی، دائما این درخت فهرست بر طبق آدرس و پاسخ مذکور به روز در آورده می شود.

روی پاسخ اجمالی و پاسخ تفصیلی که همان درخت فهرست است قابلیت انتقال به متن و عنوان باب و فصل کتاب نیز در اختیار کاربر قرار دارد.

پژوهشگر با یک جستجوی ساده می تواند تمام عناوین ابوابی را که مشتمل بر یک کلمه یا یک ریشه خاص و یا ترکیب آنها می باشد، یکجا مشاهده کند.

9 عرضه چند محیط جستجو به طور همزمان:

در بعضی از برنامه های جدید نور مانند «جامع احادیث نور (2) » به منظور افزایش توان پژوهشی کارتابل جستجوی نرم افزار، ویژگی جدیدی به برنامه افزوده شده است. در «جامع احادیث نور (2) » چهار محیط جستجو در قالب چهار کارتابل توان تحقیقاتی برنامه را ده چندان نموده است.

با داشتن چهار محیط مجزا به طور هم زمان 4 فهرست کلمات متن، 4 فهرست کلمات ابواب و فصول، (4 * 3) گروه وایلدکارد متن و (4 * 3) گروه وایلد جستجو در ابواب، و 4 خط ورودی کلمات ترکیبی و 4 محیط برای 4 نوع دامنه فیزیکی و محتوایی در اختیار کاربر می باشد و هم زمان همه اینها با هم می توانند فعال باشند. کاربر می تواند چهار گونه جستجوی مختلف و چهار محیط پاسخ اجمالی و تفصیلی داشته باشد. افزایش توان پژوهشی استفاده از چند محیط هم زمان، در بخش بعد که «دامنه» را مورد بحث قرار می دهیم بسیار روشن تر خواهد شد.

پی نوشت ها:

1) در مورد تغییر واحد نمایش متن از صفحه به پاراگراف در شماره 8 و 9 ره آورد نور، مقاله «سیمای نرم افزارهای جدید نور» توضیحاتی عرضه شد که برای آگاهی بیشتر می توانید به آنجا مراجعه نمایید.

2) Annotate

3) High Light

4) Indexing

قیمت بک لینک و رپورتاژ
نظرات خوانندگان نظر شما در مورد این مطلب؟
اولین فردی باشید که در مورد این مطلب نظر می دهید
ارسال نظر
پیشخوان