خبر
تازهترین نرم افزارهای ارائه شده توسط پژوهشگران ایرانی
- خبر
- نمایش از یکشنبه, 04 تیر 1391 16:04
- بازدید: 3604
برگرفته از روزنامه اطلاعات
ساخت نرم افزاری کاربردی برای پردازش متون و گفتار فارسی
با توجه به اهمیت توسعه خط و زبان فارسی در محیط رایانهای و مورد توجه قرار گرفتن آن در برنامههای راهبردی کشور، تولید زیرساختها و نرم افزارهایی که بتوانند این موضوع را تحقق بخشند، حائز اهمیت فراوان است. بر این اساس نرم افزار تولید درخت بانک پیکره متنی زبان فارسی به عنوان یکی از زیرساختهای مدل سازی نحو جملات زبان فارسی برای تولید و توسعه نرم افزارهای کاربردی پردازش متون و گفتار فارسی با همکاری دبیرخانه شورای عالی اطلاع رسانی و آزمایشگاه زبان شناسی دانشگاه تهران تهیه شده است.
درختبانک گروههای نحوی متون فارسی امکان تعبیر و تفسیر جملات زبان فارسی در سطح نحو را برای تولید و توسعه نرم افزارهای کاربردی پردازش متون و گفتار فارسی در محیط رایانهای ایجاد میکند. با توجه به این که در سال 1384 بخشی از زیرساختهای مورد نظر در چارچوب طرح دادگان ملی زبان فارسی در دبیرخانه شورای عالی اطلاع رسانی پیش بینی و طراحی شد و در سال 1386 در جهت استاندارد سازی بخشی از این دادگان تحت عنوان «پیکره متنی زبان فارسی» گام اولیه برداشته شد، تولید درخت بانک متون این پیکره در دستور کار کار گروه خط و زبان فارسی در دبیرخانه قرار گرفت. هدف از طرح فعلی نوشتن نرم افزاری بود که بتواند با دقت قابل قبولی متون پیکره را در قالب یک نظریه زبان شناختی تجزیه و تحلیل نحوی کند تا از میزان کار دستی به میزان زیادی بکاهد. مسئله اصلی استخراج قواعد دستوری زبان نوشتاری فارسی است که با استفاده از سیستم برچسبهای نحوی ـ معنایی پیکره متنی زبان فارسی به دست میآید.
دستاوردهای این طرح نرم افزاری است که متون پیکره متنی زبان فارسی را تقطیع، کلمات چندقطعهای را استخراج و قطعههای چند واحدی را شناسایی میکند و در نهایت گروه بندی نحوی اجزای تشکیل دهنده جملات را با بررسی برچسبهای اجزای کلام پیکره انجام میدهد. برای صحت سنجی و بررسی چالشهای موجود در تولید نرم افزار خودکار درخت بانک نحوی جملات فارسی اصلاح دستی درخت بانک یکصد پرونده متنی کم حجم نیز صورت گرفته است.
این نرمافزار اکنون توسط شورا در اختیار پژوهشکده پردازش هوشمند علائم قرار گرفته است و به زودی به صورت رایگان به متقاضیان ارائه خواهد شد.
در ضمن متقاضیان استفاده از این نرم افزار نیاز به فایلهای پیکره متنی زبان فارسی به عنوان ورودی و محتوای نرم افزار دارند که بر اساس تفاهم نامه دبیرخانه شورای عالی اطلاع رسانی با پژوهشکده پردازش هوشمند علائم که گرد آورنده اصلی فایلهای پیکره متنی است، فایلهای مذکور با تخفیف ویژه به مراکز علمی و دانشگاهها ارائه میشود. خروجی این نرم افزار، همان درخت بانک نحوی جملات پیکره متنی زبان فارسی خواهد بود و اجزای نظام تولید درخت بانک نحوی جملات فارسی و تحلیل نتایج نیز در قالب دو گزارش تشریح شده است که در آینده در قالب کتابی به چاپ خواهد رسید.
تولید نرم افزار آنتی ویروس بومی
ویروسهای رایانهای قطعهای از نرم افزار است که بر دوش یک برنامه حقیقی حمل میشود. یک ویروس میتواند خود را به برنامهای نظیر "واژه پرداز" متصل (الحاق) کند.
هر بار که برنامه واژه پرداز اجرا میشود، ویروس نیز اجرا و این فرصت را پیدا خواهد کرد که نسخهای از خود را دوباره تولید یا آسیبی به سیستم وارد کند. یک ویروس مدرن و پیشرفته قادر خواهد بود تا آسیبهای غیر قابل پیش بینی را ایجاد کند به گونهای که ویروسهایی چون ملیزا (Melissa) که در سال 1999 متداول شد از چنان قدرت و توانی برخوردار بود که شرکتهای بزرگی نظیر مایکروسافت و سایر شرکتهای بزرگ را مجبور به خاموش کردن کامل سیستمهای پست الکترونیکی کرد.
همچنین ویروس"ILOVEYOU" ، که در سال 2000 منتشر شد باعث آسیبهای فراوان در اینترنت و شبکههای رایانهای شد. با توجه به حملات سایبری که در شبکههای اینترنتی ایجاد شد، معاونت علمی پروژه کلانی را در زمینه تولید نرم افزارهای بومی آنتی ویروس تعریف و اجرایی کرد. در این پروژه پژوهشگران مرکز تخصصی آگاهی رسانی، پشتیبانی و امداد رایانهای (آپا) دانشگاه شیراز اقدام به تولید ضد بدافزار بومی (آنتی ویروس) کردند. در حال حاضر این پروژه نهایی و رونمایی شده است.
تولید نرم افزار متن خوان
پژوهشگران یکی از شرکتهای دانش بنیان نرم افزاری را به حجم 7 مگابایت ارائه دادند که علاوه بر آن که میتواند متن را به صوت تبدیل کند، با نصب روی گوشیهای همراه میتواند پیامک ارسالی را برای کاربر بخواند.
این نرم افزار قادر است فایلهای متنی را با کیفیت صدایی شبیه انسان و بدون لرزش به گفتار تبدیل کند.
این نرم افزار قابل نصب روی گوشی تلفن همراه و رایانه است و میتواند یک کتاب 200 صفحهای با فرمتهای DOC ،DOCX و PDF را به فایل صوتی wav و mp3 گفتاری تبدیل کند. این نرم افزار با باز کردن فایل متنی شروع به خواندن آن میکند. اساس این نرم افزار علم «پردازش زبان طبیعی» است به این صورت که با آنالیز و پردازش روی متن آن را تبدیل به صوت و با زبان مورد نظر ارائه میدهد.
نرم افزار تولید شده برای زبان فارسی تنظیم شده است و با نصب روی گوشیهای تلفن همراه میتواند پیامک را برای کاربران نابینا یا در حین رانندگی برای کاربران بخواند بدون آن که کاربر به تنظیمات خاصی دست بزند. علاوه بر این با نصب این نرم افزار در گوشیهای همراه میتوان متنی را در گوشی ذخیره کرد و در زمانهای مورد نیاز متن را به صورت صوت به کاربر ارائه داد.
حجم کم این نرم افزار از دیگر قابلیتهای آن است. نرم افزارهایی که تاکنون در دنیا عرضه شدهاند با حجم 400 تا 500 مگابایت است ولی در این پروژه با استفاده از روشهای خاصی حجم نرم افزار تولید شده به 7 مگابایت کاهش یافت.
با توجه به این که این نرم افزار بر روی کامپیوترها هم قابل نصب است، خروجی این نرم افزار روی رایانههای شخصی فایلهای MP3 است به گونهای که کتابهای متن به کتاب گویا تبدیل و به کاربر ارائه میشود.
این پروژه به مدیریت «سمیه باقربیگی» و با همکاری مهندس «مهدی گلزارنیا» اجرایی شد. تبدیل گفتار به متن از برنامههای توسعهای این نرم افزار است که در دستور کار قرار دارد.