1403/02/06
فردین اخلاقیان طاب

فردین اخلاقیان طاب

مرتبه علمی: دانشیار
ارکید:
تحصیلات: دکترای تخصصی
اسکاپوس: 9635715500
دانشکده: دانشکده مهندسی
نشانی:
تلفن:

مشخصات پژوهش

عنوان
طراحی و پیاده سازی سیستم تصحیح املا در زبان کردی با استفاده از روش کدگذاری soundex
نوع پژوهش
مقاله ارائه شده کنفرانسی
کلیدواژه‌ها
تشخیص خطا ، تصحیح خطا ، سیستم کنترل خطا ، روش کدگذاری soundex
سال 1391
پژوهشگران ئاسو بزرگ پناه ، فردین اخلاقیان طاب ، وفا بارخدا

چکیده

اگرچه برای تشخیص و تصحیح خطا تا کنون الگوریتمهای زیادی پیشنهاد شده است ولی در این میان الگوریتمهایی که از روشهای - کدگذاری استفاده میکنند جایگاه ویژهای دارند. روش کدگذاری Soundex یکی از شناخته شده ترین و پرکاربردترین الگوریتمهای کدگذاری است که بویژه در زبانهایی که نظام آوایی خاصی دارند، همچون انگلیسی، مفید واقع شده است. با توجه به نحوه کدگذاری در این روش و همچنین ساختار ویژه زبان کردی، میتوان از این الگوریتم به شکل مناسب در سیستم تصحیحگر املای کردی استفاده کرد و درصد بالایی از خطاهای نوشتاری در این زبان را شناسایی و تصحیح نمود. اساس کدگذاری soundex بر پایه نحوه تلفظ کردن همخوانهاست. در این روش به چهار همخوان اول مطابق جدول از پیش تعریف شدهای، کد تعلق گرفته در حالیکه به واکهها هیچ کدی تعلق نمیگیرد. شناسایی و تصحیح خطا بر اساس کد تعلق گرفته به کلمه و مقایسه با کدهای موجود در پایگاه داده است. مطابق با آمارها و مطالعاتمان، 45.58 درصد از کل خطاهای موجود در متون کردی مربوط به واکهها و چند همخوان ویژه زبان کردی میباشد؛ بدین معنا که در کلمات مختلف، واکهها و آن چند همخوان که شیوه نگارش آنها به هم نزدیک است، به اشتباه به جای همدیگر مورد استفاده قرار میگیرند. بنابراین با استفاده از روش soundex درصد بسیار قابل توجهی از کل خطاهارا با استفاده از این روش می توان اصلاح نمود. نتایج شبیه سازیها نشان میدهد که 36/94 درصد از کل خطاها با استفاده از این روش قابل اصلاح می باشد.