عنوان
|
طراحی و پیاده سازی سیستم تشخیص نوری (OCR) برای زبان کردی
|
نوع پژوهش
|
طرح پژوهشی خاتمه یافته
|
کلیدواژهها
|
سیستم های تشخیص تصویری کلمات، خط کرسی، قطعه بندی، زبان کردی، دستنویس.
|
چکیده
|
سیستم های تشخیص نوری (تصویری) کلمات یا همان ( OCR) امروزه دیگر یکی از سودمندترین فناوری هایی هستند که در زمینه های مختلف علوم بکار گرفته شده اند. این تکنولوژی از مهمترین شاخه های بازشناسی متن است که عبارت است از بازشناسی خودکار متون موجود در تصاویر اسناد و تبدیل آنها به متون قابل جستجو و ویرایش توسط رایانه. پس از طرح این ایده کلی، پژوهشگران این فناوری را بر بستر زبان های مختلف بشری طراحی کرده و توسعه داده اند و رفته رفته زبان های دیگر علی الخصوص زبان های با الفبای بهم چسبیده چون: عربی و فارسی- که توجه ما در این تحقیق بر زبان کردی معطوف شده است- نیز به این جرگه پیوستند. پس از تکوین این فناوری نوظهور سیستم های تشخیص تصویری واژگان برمبنای دو مرحله اساسی لحاظ گردید. که این مراحل عبارتند از: استخراج خط کرسی و قطعه بندی که تقریبا در تمامی متدهای موجود در این حوزه کاربرد دارند. بنابراین بدیهی است بهبود بخشیدن به سازوکار این دو فعالیت تاثیر بسزایی در عملکرد کل سیستم تشخیص واژگان می گذارد. در این تحقیق با معرفی دو روش جدید مبتنی بر نوشته های دستنویس، برای پیاده سازی این دو فعالیت به گونه ای ساده تر و بالتبع سریعتر به دنبال طراحی سیستمی حداقل هم سنگ آخرین تلاش های انجام شده در زمینه زبان های با الفبای بهم چسبیده و برای زبان کردی بوده ایم. صفحات پیش رو به شرح و توضیح بیشتر این فعالیت ها، پس از آن معرفی متد های پیشنهادی ما و سپس ارائه نتایج آزمایش آن ها بر پایگاه داده تصویری زبان کردی، بصورت جداگانه اختصاص یافته اند.
|
پژوهشگران
|
بصیر سلیم علاقه بند (همکار)، وریا فتحی (همکار)، فاطمه دانشفر (مجری اول)
|