ورود اطلاعات، همگام با پیشرفت فن آوری رایانه ای

گفتگوبامسئول بخش ورود اطلاعات مرکز تحقیقات کامپیوتری علوم اسلامی

گفتگوبامسئول بخش ورود اطلاعات مرکز تحقیقات کامپیوتری علوم اسلامی

اشاره

بخش ورود اطلاعات یکی از بخش های مهم مرکز تحقیقات کامپیوتری علوم اسلامی است.این بخش در روند تولید نرم افزارهای مرکز تحقیقات نقش عمده و اساسی را دارد. این بخش از آغاز فعالیت مرکز به صورت جدی مشغول کار بوده و در زمینه های مختلف اعم از معجم های لفظی، معجم های موضوعی و رجالی و کارهای متفرقه ای که در مرکز انجام گرفته، دخالت داشته است.

برای آشنایی بیشتر خوانندگان گرامی مجله با این بخش ،گفتگوی کوتاهی با آقای جعفر سلطان پور مسئول محترم بخش ورود اطلاعات مرکز تحقیقات کامپیوتری علوم اسلامی ترتیب دادیم که توجه شما رابه آن جلب می کنیم:

لطفا بفرمایید که بخش ورود اطلاعات چه مراحل مختلفی را برای تهیه نرم افزار از آغاز تا انتها طی می کند؟

- بخش ورود اطلاعات یکی از ارکان پایه ای مرکز است. در واقع تمام معجم های لفظی موضوعی در ابتدا از این قسمت وارد رایانه می شود و تایپ کامپیوتری آنها انجام می گیرد.این بخش از قسمتهای مختلفی شامل تایپ، تصحیح، فرمت، ریشه، اعراب، رجال، و فونت تشکیل شده است. هر کدام از این قسمتها که در این بخش فعالیت دارند در جایگاه خودشان کارهای بخصوصی را عهده دار هستند و در زمینه آماده سازی اطلاعات برای تولید نرم افزار مؤثر هستند. چرخه کار در این بخش به این صورت است که ابتدا تمام اطلاعات مورد نیاز که بنا است معجم الفاظ یا موضوعات یا رجال بر اساس آنها تهیه شود توسط دو نفر تایپیست تایپ می شود. سپس مطالب تایپ شده در قسمت تصحیح توسط یکی از مصححان به صورت تصحیح مقابله ای و به کمک نرم افزاری که برای همین منظور در خود مرکز تهیه شده مورد بازبینی و اصلاح قرار می گیرد. ما در این مرحله یکی از بهترین روشها را برای تصحیح متن اطلاعات به کار گرفته ایم یعنی پس از حدود هشت الی نه سال تجربه به این نتیجه رسیدیم که اطلاعات را به صورت تصحیح مقابله ای کنترل و اصلاح کنیم. این روش علاوه بر اینکه با هزینه کمتری قابل انجام است، سرعت بیشتری را به همراه می آورد و از قابلیت اعتماد بیشتری نیز برخورداراست.

در اینجا لازم است اشاره ای هم به سیر تکاملی روشهای کار در بخش ورود اطلاعات بکنیم. در شروع کار در سال 1368 که کارها به صورت گروهی آغاز شد، با توجه به تکنولوژی آن موقع، تایپ را بر روی کمادور انجام می دادیم و نمایش متون بر روی تلویزیون های سیاه و سفید صورت می گرفت. آنگاه پس از تایپ و گذراندن مرحله تصحیح، مطالب را جهت سازگار کردن با کامپیوتر «آی بی ام » به کمک نوارهای مخصوصی به «آی بی ام » منتقل و سازگار می کردیم. این روش در واقع باعث کندی کار و تحمیل هزینه زیادی در آن موقع می شد. اما با گذشت زمان و با توجه به پیشرفت تکنولوژی رایانه، از سال 69 به بعد تایپ بر روی کامپیوتر صورت می گرفت که این امر باعث افزایش سرعت در کار شد. ما در طول این سالها به منظور بهینه سازی اطلاعات و نیز جهت بهبود روند تبادل اطلاعات بین گروهها و قسمتهای مختلف توانستیم همگام با روند رو به رشد تکنولوژی، پیشرفت مناسبی داشته باشیم.

هم اکنون پس از گذشت 8 سال به نتایج خیلی خوب و مثبتی در بخشهای گوناگون رسیده ایم و بیشتر کارها روی کامپیوتر انجام می شود. مثلا در آن زمان بخشی از کارها به صورت دستی انجام می شد. از جمله در قسمتهای فرمت و اعراب، این طور عمل می شد. ولی پس از نوآوری های پدید آمده در تکنولوژی کامپیوتر و با فراگیری روشها و کسب تجربیات جدید، الان همه کارهایمان روی کامپیوتر صورت می گیرد.

پس از انجام مراحل تایپ و تصحیح، محصول کار برای فرمت گذاری و دامنه گذاری به قسمت فرمت انتقال داده می شود. در قسمت فرمت -که یکی از قسمتهای مهم بخش ورود اطلاعات است- کار فرمت گذاری در قالب دامنه های مختلف انجام می شود. این دامنه ها با توجه به نوع و موضوع کار، مختلف هستند. مثلا در موضوعات فلسفی یک نوع فرمت داریم، در تفسیر فرمتی دیگر و همین طور در اصول یا در فقه و یا تاریخ فرمت های خاص هر یک را اعمال می کنیم. در این قسمت محققان تمام متن های تهیه شده را بر روی کامپیوتر فرمت گذاری می کنند و دامنه هایی که از قبل تعیین شده و نیز فرمت هایی که لازم است در آن لحاظ شود را بر روی متون اعمال می کنند. ما در جریان این کار، گاهی با دامنه های متعددی در حد 75 یا 80 دامنه روبرو هستیم. به عنوان مثال در قسمت فرمت دامنه هایی نظیر آیه، روایت، سند، اعلام، اشعار، پاورقی ها، اعلام اشخاص یا اماکن، روایت قدسی، و معصومین علیهم السلام را داریم که هر کدام از آنها نیز برای خود دامنه مخصوصی را دارا هستند. تمام اینها در آن متون لحاظ می شود.

پس از اینکه متون، کاملا فرمت گذاری شد در نهایت به طور مکانیزه و کامپیوتری، تصحیح فرمت در مورد آنها صورت می گیرد. به عبارت دیگر تمام فرمت هایی که انتخاب شده -و در واقع باز و بسته هایی که برای دامنه های مختلف در نظر گرفته شده- کاملا کنترل می شود.

پس از اینکه در مرحله اخیر، اطلاعات فرمت گذاری شد جهت اعراب گذاری به قسمت اعراب -که آن هم یکی از قسمتهای مهم در بخش ورود اطلاعات است- ارسال می گردد. در این قسمت ابتدا لیست غیر تکراری از کلمات اعراب گذاری شده در متون به صورت کامپیوتری تهیه می شود. پس از آن افرادی از متخصصان علم صرف و نحو مشغول اعراب گذاری می شوند و پس ازآنکه متن را به طور کامل از اول تا آخر خواندند، موارد اشکال را اصلاح می کنند. با توجه به تجارب چندین ساله ای که داریم، می توانیم بگوییم که این قسمت یکی از مهم ترین قسمتهایی است که در مرکز فعالیت دارد و گروهی که در مرکز مشغول اعراب گذاری هستند در نوع خود منحصر به فرد هستند. همکاران ما در این قسمت با توجه به مطالعاتی که در زمینه لغت و ادبیات عرب دارند و به کمک تجارب ارزنده ای که در کار خود اندوخته اند; سعی کرده اند متون را به بهترین نحو اعراب گذاری کنند و از میان وجوه مشترک، وجوه بهتر را انتخاب نمایند.

کار اعراب گذاری ضمن آنکه یک کار علمی-هنری برای متون به حساب می آید، موجب تسریع در جستجو -بویژه در بعضی از موارد که هیئت کلمه مشترک است- می شود. در این قسمت پس از اتمام مرحله اعراب گذاری و گرفتن لیست غیر تکراری از کلمات، لیست تهیه شده با کتابهای دیگر هماهنگ می شود. گاهی نیز در خود کتاب هماهنگ سازی نهایی انجام می گیرد. در واقع متون پس از طی مراحل مذکور به صورت اعراب خورده و کامل آماده می شود.

پس از این مرحله، متون اعراب گذاری شده برای ریشه یابی به واحد مربوط منتقل می شود. در این واحد نیز لیست غیر تکراری از ریشه کلمات تهیه و برای بازبینی آماده می شود. سپس لیست غیر تکراری اطلاعات تصحیح و کامل می شود و ریشه یابی در متن توسط برنامه ای که از سوی همکاران تولید شده به شکل کامپیوتری انجام می پذیرد. ریشه یابی کلمات یکی از فعالیتهای مهم در چرخه کار است و باعث تسریع در جستجو می گردد. همچنین امکان دسترسی به مشتقات از طریق ریشه کلمه با جستجوهای مختلف در ریشه فراهم می شود. پس از اتمام کار ریشه یابی، اطلاعات حاصله جهت آماده سازی، کنترل دامنه های مختلف و بازیابی ریشه ها و اعراب به قسمت آماده سازی اطلاعات می آید و نهایتا برای تولید نرم افزار به بخش نرم افزار تحویل داده می شود.

علی رغم اینکه در بخش ورود اطلاعات از امکانات و تکنولوژی مدرن روز استفاده می کنید، متاسفانه گاهی مشاهده می شود که در تولید برنامه اشتباهات و غلطهای نوشتاری وجود دارد. برای اینکه این گونه اشکالات به حداقل برسد یا اصلا وجود نداشته باشد، چه اقداماتی انجام داده اید؟

البته وقوع برخی اشتباهات در آغاز هر کاری طبیعی است. باید توجه کنیم که روشهای جدید رو به تکامل است و اطلاعات ما نیز همیشه پویا است یعنی این طور نیست که ما تنها یک بار روی یک مجموعه اطلاعات کار کنیم بلکه برای نسخه های مختلف برنامه ها اطلاعات پیوسته مورد ملاحظه مجدد قرار می گیرد و لذا هر بار این احتمال که برنامه ها اصلاح شود وجود دارد. بنا بر این هر چند نسخه های اولیه برنامه هایمان حاوی اشتباهاتی بوده -و این امر قابل انکار نیست - اما با توجه به روشهایی که در تولید برنامه ها به کار گرفته می شود و همچنین امکانات جدیدی که روی برنامه ها قرار می گیرد (اعم از فونت، ریشه، یا بعضی از قسمتهای دیگر); این اشکالات گرفته می شود. بعلاوه خود کاربران نیز در ضمن استفاده از بانک های اطلاعات اشتباهات احتمالی را که می بینند، یادداشت نموده و به ما اعلان می کنند و ما نیز این اشکالات را اصلاح می کنیم.

با توجه به امکانات و تجربیات خوبی که هم اکنون در اختیار دارید، آیا می توانید این تضمین را بدهید که برنامه هایی که در آینده ارائه می کنید خالی از این گونه اشکالات باشد؟

البته اینکه بخواهیم ادعا کنیم از این پس هیچ اشتباهی در برنامه های ما وجود نخواهد داشت، کار دشواری است، چون همواره این احتمال در مراحل تهیه برنامه وجود دارد که اشتباه جدیدی پیدا شود یا حتی به طور ناخواسته اضافه شود اما این را می توانیم بگوییم که با توجه به اینکه تمام کارها به طور مکانیزه صورت می گیرد، درصد اشتباهات در برنامه های جدید بسیار ناچیز است. البته این درصد بسیار کمتر از احتمال وقوع در کتابهایی است که چاپ می شوند. علت آن است که ما به کمک لیست های غیر تکراری، اغلاط را بازبینی می کنیم در حالی که روش تصحیح مقابله ای الکترونیکی که از سوی ما اعمال می شود در اختیار مصححان چاپ کتب نیست.

از بدو تاسیس بخش ورود اطلاعات -که شاید زمان آن به قبل از تاسیس رسمی مرکز برگردد- تا الان چه مقدار اطلاعات و دیتا به کامپیوتر داده شده است؟

در زمینه معجم های الفاظ تا کنون بر روی نزدیک به 2 هزار جلد کتاب کار کرده ایم. در مورد موضوعات نیز زونکن های زیادی کار شده است که شمارآنها به بیش از1000 زونکن می رسد. در زمینه رجال هم روی اسناد کتب رجالی کار شده، همچنین در زمینه تاریخ و متون تاریخی کار شده است. این موارد در مجموع، آمار بالایی را در ورود اطلاعات تشکیل می دهند.

هم اکنون چه برنامه هایی را در دست اجرا دارید؟

پروژه هایی که در حال حاضر در دست ما است و مشغول انجام کار روی آنها هستیم عبارت اند از: پروژه اصلی فقه، برنامه نور الجنان، و موسوعه نهج البلاغه. برنامه نور العترة نیز مراحل نهایی کار را می گذراند.

این برنامه ها در چه مراحلی قرار دارند و چند درصد از کار آنها انجام شده است؟

نور العترة -همان طور که اشاره شد- آخرین کارها بر روی آن در حال انجام است (در واقع 95% کار آن پایان یافته)، برنامه اصول در حدود 80% کار آن انجام شده، برنامه فقه نیز تا حدود 60% آماده شده، نور الجنان تا 30% و موسوعه نهج البلاغه حدود 40% کار را پشت سر گذاشته اند.

آن طور که شنیده ایم، در بخش ورود اطلاعات ابتکارات متعددی در قسمتهای مختلف برای تولید برنامه ها با روشهای نو و مدرن وجود داشته است; لطفا در حد امکان در خصوص این ابتکارات توضیح دهید.

خوشبختانه کار در بخش ورود اطلاعات، در قسمتهای مختلف، روند رو به رشدی داشته است. یکی از نخستین ابتکارات این بخش، تصحیح مقابله ای متون به صورت مکانیزه به کمک برنامه مربوط به آن است (که در آغاز این گفت و گو به آن اشاره شد). ابتکار دیگر، انجام مستقیم فرمت روی خود کامپیوتر است.

مزیت این روش این است که امکان مانور روی اطلاعات کامپیوتر از این طریق بیشتر است بویژه با توجه به اینکه همکاران ما در گروهها در تست های کاری خودشان از روشهای تعریف ماکرو استفاده می کنند، سرعت کار هم بالا می رود.

نکته قابل توجه دیگر این است که اعراب -بر خلاف گذشته که روی کتاب وارد می شد و سپس تایپیست ها این اعراب را وارد کامپیوتر می کردند و پس از آن از روی کامپیوتر، اصلاحات انجام می شد- با استفاده از روشهای جدید، اعراب روی کامپیوتر وارد می شود و دیگر کار روی کتاب نداریم. در قسمتهای دیگر هم ابتکاراتی داشته ایم که هر یک به سهم خود باعث رشد کار و سرعت در فعالیتها شده است.

به عنوان آخرین سؤال، مایل هستیم نظر شما را در مورد بحثی که این روزها در بین مؤسسات و مراکز تولید کننده نرم افزار تحت عنوان «دیتا اینتری » مطرح است بدانیم. همان طور که مطلع هستید با استفاده از این روش، بعضی مراکز با تهیه متون آن را به دیگر مؤسسات عرضه می کنند و یا به تبادل اطلاعات می پردازند و کم کم شاهد مبادله و خرید و فروش اطلاعات هستیم. آیا مرکز با این سیاست موافق است یا نظر دیگری در این خصوص دارد؟ و آیا می تواند پروژه های دیگر مؤسسات را به صورت اخذ سفارش انجام دهد یا وارد بازار اطلاعات شود؟

البته از سوی مسئولان مرکز در مورد مسئله تبادل اطلاعات اعلان نظر شده است. مرکز آماده است کلیه اطلاعات فراهم شده را در مقابل دیتاهایی که تحویل می گیرد به صورت تبادل اطلاعات عرضه کند و یا آن را با یک سوم هزینه در اختیار متقاضیان قرار دهد. تا کنون نیز در این زمینه در چند مورد، اطلاعاتی را به صورت پایاپای داد و ستد کرده ایم. با توجه به روشهای مختلفی که در مرکز وجود دارد و روش خاصی که مرکز تحقیقات کامپیوتری علوم اسلامی در زمینه تهیه معجم های الفاظ به کار گرفته است، بسیاری از اطلاعاتی که در مراکز دیگر تهیه می شود از نظر ساختاری به گونه ای است که احتمالا مورد نیاز مرکز نیست ولی در عین حال ما اعلان آمادگی کرده ایم که اطلاعات خودمان را در اختیار درخواست کنندگان قرار دهیم. ضمنا مرکز آماده است تا با مشارکت مؤسسات متقاضی، سیستم ورود اطلاعات را برای کتب مورد نظر آنان راه اندازی کرده و در این راه مساعدت نماید و یا از طرف آنها متکفل انجام آن گردد. ما تاکنون پیشنهادهایی هم در این زمینه داشته ایم که در حال پی گیری و بررسی است. همچنین همکاریهایی نیز با برخی مراکز صورت پذیرفته است.

از فرصتی که در اختیار «ره آورد نور» قرار دادید، متشکریم.

قیمت بک لینک و رپورتاژ
نظرات خوانندگان نظر شما در مورد این مطلب؟
اولین فردی باشید که در مورد این مطلب نظر می دهید
ارسال نظر