عنوان
|
طراحی و پیاده سازی سیستم تصحیح املا در زبان کردی با استفاده از روش کدگذاری soundex
|
نوع پژوهش
|
مقاله ارائه شده کنفرانسی
|
کلیدواژهها
|
تشخیص خطا ، تصحیح خطا ، سیستم کنترل خطا ، روش کدگذاری soundex
|
چکیده
|
اگرچه برای تشخیص و تصحیح خطا تا کنون الگوریتمهای زیادی پیشنهاد شده است ولی در این میان الگوریتمهایی که از روشهای - کدگذاری استفاده میکنند جایگاه ویژهای دارند. روش کدگذاری Soundex یکی از شناخته شده ترین و پرکاربردترین الگوریتمهای کدگذاری است که بویژه در زبانهایی که نظام آوایی خاصی دارند، همچون انگلیسی، مفید واقع شده است. با توجه به نحوه کدگذاری در این روش و همچنین ساختار ویژه زبان کردی، میتوان از این الگوریتم به شکل مناسب در سیستم تصحیحگر املای کردی استفاده کرد و درصد بالایی از خطاهای نوشتاری در این زبان را شناسایی و تصحیح نمود. اساس کدگذاری soundex بر پایه نحوه تلفظ کردن همخوانهاست. در این روش به چهار همخوان اول مطابق جدول از پیش تعریف شدهای، کد تعلق گرفته در حالیکه به واکهها هیچ کدی تعلق نمیگیرد. شناسایی و تصحیح خطا بر اساس کد تعلق گرفته به کلمه و مقایسه با کدهای موجود در پایگاه داده است. مطابق با آمارها و مطالعاتمان، 45.58 درصد از کل خطاهای موجود در متون کردی مربوط به واکهها و چند همخوان ویژه زبان کردی میباشد؛ بدین معنا که در کلمات مختلف، واکهها و آن چند همخوان که شیوه نگارش آنها به هم نزدیک است، به اشتباه به جای همدیگر مورد استفاده قرار میگیرند. بنابراین با استفاده از روش soundex درصد بسیار قابل توجهی از کل خطاهارا با استفاده از این روش می توان اصلاح نمود. نتایج شبیه سازیها نشان میدهد که 36/94 درصد از کل خطاها با استفاده از این روش قابل اصلاح می باشد.
|
پژوهشگران
|
ئاسو بزرگ پناه (نفر اول)، وفا بارخدا (نفر سوم)، فردین اخلاقیان طاب (نفر دوم)
|