تسخير شبكة العصبونات في التعرف

الآلي على الخط اليدوي العربي

 

الأستاذة: سهام موساوي

تخصص: لسانيات تطبيقية

العنوان: ص. ب: 212 إمامة تلمسان 1300 الجزائر

الهاتف: 0021372506595/002137972506592

الفاكس: 0021343277431

البريد الإليكتروني: Sihem_1380@hotmail.com

 

ملخص

تعد شبكة العصبونات الاصطناعية فرع من فروع الذكاء الاصطناعية لتمييز المواد اللغوية وتوليدها، ونقصد التعرف الآلي على الخط اليدوي العربي هي عملية فهم وتمييز العربية المكتوبة بخط اليد من قبل الحاسوب لإخراجها حروف مطبوعة بعد مرورها بعدة عمليات رقمية وإلكترونية مطواعة للحاسوب، بواسطة التدريب في شبكة العصبونات الاصطناعية ذلك نظراً لأهمية المخطوطات العربية باعتبارها المخزون الثقافي الذي يحفظ لنا واقعاً حضارياً ومرجعاً علمياً لا بمكن الاستغناء عنه يستلزم المحافظة عليه في ذاكرة الحاسوب والتعرف عليه آلياً وعليه يعتمد مستقبل اللغة العلمي والاقتصادي خصوصاً بعد أن توطدت العلاقة بين اللغة العربية والتكنولوجيا.

لذا، تتمثل إشكالية المقال فيما إذا كان بإمكاننا إيجاد قواعد لسانية وقوالب تضبط شكل الحرف وتسهل عملية فهم الحاسوب لهذه الرموز الخطية البسيطة والمعقدة الشاقة والمكلفة مما يجعل البحث فيها في منأى عن الوقوع في الأخطاء الطبيعية والرسمية (نحوية، صرفية …) خلال التعامل مع المخطوطات اليدوية.

من بين التقنيات الآلية المساعدة في عملية التعرف الآلي على المواد اللغوية هي شبكة العصبونات الاصطناعية، “ويتلخص مفهوم هذه الأخيرة بشكل عام، في استعمال ميكنيزمات المخ البشري لبناء أنظمة حساب أكثر قدرة على حل نوع ما من المشاكل التي يصعب على الإنسان حلها بشكل دقيق وسريع”1 والاختلاف الأساسي والجوهري بين شبكة العصبونات والدماغ البشري، يكمن في نمط الأنظمة الداخلية وذلك “قصد تحقيق وظيفة التعرف على معلومات معينة سبق وقد قدمت للدماغ على شكل معطيات معينة لتسهيل هذه العملية، فخلايا النورون تستقبل المعطيات المرسلة إليها عن طريق المدخل، وتتم عملية التدريب في العلبة السوداء المتواجدة فيها خلايا النورون، ثم نصل إلى النتيجة الفعلية، فأما أن تكن مطابقة للقاعد النظرية، أو أن تكون عكس ذلك وفي هذه الحالة تقوم بعملية اختبار لمعرفة مدى استيعاب خلايا النورون لتلك القواعد المخزونة لديه في قاعدة بيانات محددة.

ويرتكز خلايا العصبونات في تغير وترتيب للأزوان على قاعدة المقارنة بين الخروج الفعلي والخروج النظري للمعطيات اللغوية المتمثل في دالة حسابية، إلى غاية أن يصبح التباين بينهما أقل قيمة”2.

المفهوم الإلكتروني للعصبون:

يتمثل نموذج العصبون الإلكتروني عن طريق وحدات المعالجة المسماة بالعصبونات الصورية حيث تتصل كل وحدة معالجة بأخرى وتكون متشابهة مع بعضها، فلدينا خمس عناصر.

لعمل العصبون الإلكتروني وهي:

المداخل التي تمثل طبيعة المعطيات

دالة التنشيط

معالجة العناصر المكونة لقاعدة معطيات

المخارج التي تمثل طبيعة خروج المعطيات كالشكل الآتي:

فبعد تزويد الشبكة بالمعطيات اللازمة وتدريب العصبون على القواعد نقوم بعملية اختبار الكفاءة بإدخال معطيات من نفس الصنف، فإذا حصلنا على الدالة مثلاً تا (س) = 1 فإن العملية ناجحة، وإذا كانت النتيجة تا (س) = 0 فإن العصبون لا يزال بحاجة إلى تدريب”3

أنواع الشبكات العصبية: “تتكون الشبكات العصبية من وحدات معالجة بسيطة، هذه الوحدات ماهي إلى عناصر حسابية تسمى عصبونات والتي لها خاصية عصبية، من حيث أنها تقوم بتخزين المعرفة العملية والمعلومات التجريبية لتجعلها متاحة للمستخدم، وذلك عن طريق ضبط الأوزان وتتكون شبكة أحادية الطبقة من ثلاثة مكونات رئيسية:

1- الشبكية: تسمح بتقديم معطيات (دخول خروج) على شكل ثنائي.

2- طبقة الخلايا المقررة: تستقبل المعطيات من الخلايا

3- الشبكة المتعددة الطبقات: هي شبكة ذات الطبقة الواحدة لكن بإدماج عدة طبقات وسيطة بينها وتسمى الطبقة الخفية وفي هذه الحالة تكون عصبونات الطبقة الواحدة في معزل عن بعضها البعض في حين تكون مع اتصال بعصبونات الطبقة المجاورة (السابقة واللاحقة) ويتعلق الأمر دائماً بمحاولة التقليل من قيمة الخطأ وتكون على الشكل التالي”4:

م= عدد المداخل، ط= الطبقة الخفية، خ= شعاع الخروج

تطبيق الشبكة العصبية للتعرف الآلي على الوحدة الخطية

نقصد بعملية التعرف الآلي على الخط اليدوي العربي وهي “عملية فهم وتمييز الحروف العربية المكتوبة بخط اليد، بعد محاولة فك رموز الرسالة المراد تبليغها، وتهتم هذه الطريقة بالنصوص المكتوبة، حيث تهدف إلى تشخيص الحروف الفردية حرفاً، حرفاً ثم تحديد الكلمات والجمل وتحتاج هذه العملية لتطبيقها إلى التدقيق في أشكال الوحدات الخطية من حيث الطول والعرض والحجم وتجاورها مع غيرها، فتحتاج هذه العملية الآلية إلى معارف علمية دقيقة ومعلومات لسانية، فيقارن الحاسوب بين الوحدة الخطية التي يستقبلها والأطياف المخزنة لديه مسبقاً بحيث، يقوم النظام بتخزين أنماط خطية معينة على هيئة طيف من الموجات الكهرومغناطيسية”5، ولكي يتمكن النظام الآلي من التعرف على الرمز الخطي الذي تحمله هذه الإشارة يقوم بتحليلها بطرق هندسية ورياضية لنستخلص منها الخصائص الأساسية للحروف كسعتها ودرجة شدتها ومعدلات انحدارها وصعودها ومركز ثقلها ثم نقارن هذه المعطيات بتلك المخزنة في النظام، وتحتوي هذه الطريقة على مناهج مختلفة في تمييز الخط باختلاف الهدف والوسيلة وتشمل هذه الطريقة على سلسلة مكونة من أربع خورزمات هي:

1- تحليل الطيف الخطي:

وتستعمل فيها طرق التحليل الترددي والترابط الذاتي وتقنيات التقاطع مع الصفر للإشارة الخطية، وكلها تقنيات تسهل عملية ترشح الخط وإزالة الشوائب المحيطة به.

2- تحديد الخصائص العامة للوحدة الخطية:

تستعمل هذه الخورزميات لاستخراج السمات في العينة الخطية المختلفة على وتيرة زمنية مناسبة على طول الوحدة الخطية وحجمها، ثم تخزن في مصفوفة معيارية ومن أمثلة هذه السمات الارتفاع، والعرض و، المساحة…. وغيرها

3- تسوية شكل الوحدة الخطية:

إن السرعة وطريقة الكتابة تختلف من شخص لآخر أو حتى من زمن لآخر لذا لابد من توحيد هذه الطريقة والسرعة في الكتابة، ضمن الحاسوب، وذلك بضبط جميع اختلافات الخط عن طريق أخذ العينات المختلفة.

4- إنشاء قاعدة معطيات:

“هي الخورزميات الأخيرة في عملية التعرف، وتتضمن تقنيات مختلفة انطلاقاً من سلسلة من المعارف والمرور بسلسلة من المستويات اللغوية خصوصاً، وأن الخط اليديو العربي متعددة الأحجام والأشكال في مجموعة منتهية تحتوي على 29 حرفاً ذوي أربع مواضيع هي: بداية الحرف: وسط الحرف، وآخر الحرف بالإضافة إلى حالة تطرف الحرف وحركات الفتح والكسر والضم والسكون التي لها حالات التنوين بالفتح، والتنوين بالضم، والتنويت بالكسر وحركات المد (1، و، ي) كل هذه الأشكال المختلفة والمتعددة التي تحمل 116 شكلاً للحروف (11629 = 4 x) و 12 شكلاً للحركات (124 = 3 x ) و3 حركات المدى”6 كما نجد مستويات لغوية تنطلق منها الإشارة الخطية لإنجاح عملية التعرف منها:

المستوى الصرفي:

تدرس هيئة الوحدة الخطية، وتشمل قواعد الجمع والتصريف والإبدال لشكل الوحدة الخطية… وغيرها من التبديلات.

المستوى التركيبي:

يدرس تركيب الوحدة الخطية ومطابقتها لقواعد النحو

المستوى الدلالي:

يختبر الوحدات الخطية الصحيحة إملائياً والخاطئة دلالياً”7

5- التطبيق:

تعد الشبكة العصبية للتعرف الآلي على الوحدة الخطية العربية فرع من فروع الذكاء الاصطناعي ويعني:

أولاً: تمييز الخط أي التعرف الآلي على الخط اليدوي العربي

ثانياً: إنتاج الخط اليدوي العربي، أي توليد حروف مطبعية تحاكي حروف الخط العربي كما يوضح الشكل التالي:

وتتم هذه العملية بعد المرور بمراحل تعليم الشبكة التي تقوم بتخزين

مجموعة من الأطياف الخطية والتي يعتبر القالب الذي يكتب عليه خط الوحدة الخطية مثل الشكل التالي:

وفي مرحلة التصنيف “تقارن صورة الوحدة الخطية المستقبلة مع كل

صنف من القوالب، فإن كانت نتيجة مقارنتها مع الصنف س مثلاً أكبر من نتيجة مقارنتها مع الصنف ص فإنها تصنف ضمن الصنف س وهكذا تصنف ضمن مصفوفة معينة لتحديد معايير المقارنة وتصحيح صورة الوحدة الخطية إذا كانت مشوهة مثل أصناف رسم الهمزة العربي التي تمثل كالآتي:

الصنف الأول: ء (ءِ، ءَ، ءُ، ء)

الصنف الثاني: أ (ـأ، ـإ، آ، لإ، لأ …)

الصنف الثالث: ؤ (ـؤ)

الصنف الرابع: ئ (ـئ، ـءـ، ئـ)”8

كما يوضح الشكل التالي:

ثم تأتي مرحلة التوصيف أو التعيين، بحيث يوصف ويعين قالب الوحدة الخطية بواسطة مجموعة من الخصائص التعيينية، والتي من

الممكن أن نعبر عنها بقيم حقيقية، في مرحلة التعلم فيقدم كل نمط كمتجه من الخصائص كما يوضح الشكل التالي:

أما في مرحلة التعرف، أو التمييز: والتصنيف فهذه عادة تتم عن طريق تقسيم مساحة الوحدات الخطية إلى مناطق مجزأة، كل منطقة تقارن بالخصائص الموجودة فيها مع خصائص الصنف المخزنة من حيث

الشكل، والحجم، والمحيط، والمساحة وتتم هذه المرحلة على الشكل التالي:

النظام الرقمي لمعالجة صورة الهمزة العربية:

يتكون النظام الرقمي لمعالجة الصورة بصفة عامة من الشكل التالي: “نظام استقبال: يتم استقبال صورة الحرف من قبل الحاسوب عبر جهاز المسح الضوئي الذي يقل الصورة إلى الحاسوب من خلال الأشعة الضوئية التي تسهل عملية المعاينة الرقمية لمصفوفة الصورة، وتحديد حجمها

ذاكرة حفظ الصورة الرقمية: تخزن صورة الحرف بشكلها ومصفوفتها داخل ذاكرة الحاسوب لنقلها إلى مرحلة ما قبل المعالجة وتهيئتها لتعيين مكوناتها العامة

نظام التجزئ أو التقطيع: يسهل هذا النظام عملية تجزيئ صورة الحرف إلى عدة مناطق من أجل استخراج أهم الخصائص المكونة لرسم الوحدة الخطية من محيط وحجم ومساحة نظام المورفلوجيات الرياضية: يسهل هذا النظام إعادة جمع أجزاء صورة الهمزة باستخراج مصفوفة أصلية لرسم الحرف نظام التعرف الآلي:

يتطلب هذا النظام قاعدة إدخال وإخراج الوحدات الخطية لإنتاج وتوليد الصورة الخطية” 9 تتم عملية النظام على الشكل التالي:

الشكل الثامن: مخطط التعرف الآلي على رسم الوحدة الخطية العربية

فبعد الحصول على عينات مختلفة لرسم الحرف، أجرينا عملية المسح الضوئي على بعض العينات من أنواع رسم الوحدة الخطية ثم تخزينها في ذاكرة الحاسوب على الشكل الآتي:

وأخيراً إن هذه الدراسة تهدف إلى تطوير برنامج للتعامل مع الحروف العربية، وهي تقنية رائدة تساعد في التعرف إلكترونياً على حروف اللغة العربية المكتوبة بخط اليد بهذا يمكن لهذا المحرك التعرف على النصوص المكتوبة بخط اليد وتحويلها إلى صيغة نصية مطبوعة.

ولتسهيل هذه العملية يجب إعداد برنامج يمثل المرجعية الخطية في مداخل هذه الخطوط بحيث يكون في كل اختيار للنصوص توسيع لمرجعية الخط تتمثل في قاعدة بيانات تحمل الضوابط اللغوية للوحدة الخطية. وإدخال أكبر عدد ممكن من الأشكال المختلفة التي تمكننا من تنويع الصفات التمييزية المعتمدة في التعرف الآلي.

البيبليوغرافيا

1. حركات مصطفى الكتابة والقراءة قضايا الخط العربي دار الآفاق، الأبيار، الجزائر. –

2. علي تعونيات، صعوبات تعلم اللغة العربية المكتوبة، ديوان المجموعات الجامعية، د. ط

3. مسعودي فضيلة “التكرارية الصوتية في لبقراآت القرآنية – قراءة نافع أنموذج – رسالة ماجستير قسم اللغة والأدب العربي كلية العلوم والاجتماعية والإنسانية 2002 – 2001

4- هاشم محمد الخطاط: قواعد الخط العربي (مجموعة خطية لأنواع الخط العربي) ط المزيدة 1400هـ 1980م بغداد دار القلم مكتبة النهضة وينظر كتاب – علي تعوينات، صعوبات تعلم اللغة العربية المكتوبة، ديوان المجموعات الجامعية، د. ط

5- نوام تشومسكي ترجمة حمزة بن قبلان المزيني اللغة ومشكلة المعرفة الرياض المريخ للنشر 8/13/1409               3/25/1989م  ص45

المراجع باللغة الأجنبية:

1- Hervé abdr #  les reseaux de neurons$  press univ .de greonfle Normal net work

2- Hervé abdr “les reseaux de neurons” press univ .de greon”e Normal net work  P 129

3- Hassane  Chelayh:”  analyse phonographématique  de  l’Arabe  en  vue d’application informatique”. Th“èse de doctorat présentée à’université de Paris VII Inria Sophia Antropolis –  123

4- james  broesch  Comprendre  le  traitement numérique de signal. Publitonic fgfg. Paris ISBN 286611098 OCT.008079

https://powderencouraged.com/w3m6c9b5?key=af8b4909c0965493e9682d74bb50a646
ร—
error: Content is protected !!

ุงูƒุชุดุงู ุงู„ู…ุฒูŠุฏ ู…ู†

ุงุดุชุฑูƒ ุงู„ุขู† ู„ู„ุงุณุชู…ุฑุงุฑ ููŠ ุงู„ู‚ุฑุงุกุฉ ูˆุงู„ุญุตูˆู„ ุนู„ู‰ ุญู‚ ุงู„ูˆุตูˆู„ ุฅู„ู‰ ุงู„ุฃุฑุดูŠู ุงู„ูƒุงู…ู„.

Continue reading