الجمعة، 28 مايو 2010

النصوص (السيناريو)

إن برنامجاً من مارجي يقوم بعدد كبير من الاستنتاجات التي تقع خارج سياق المادة موضع البحث، وهناك في الواقع مخاطرة أن يتسبب التفجر التوافقي combinatorial explosion في فشل محاولة الحد من عدد الاحتمالات المطروحة. وقد أمكن التوصل إلى حل جزئي للمشكلة باستخدام فكرة النصوص أو السيناريو لربط الجمل المتتالية وفرض قيود كالعلاقات السببية.وكان كل من روجر شانك وروبرت ابيلسون أول من قدم فكرة استخدام السيناريو، وتتلخص في أن السيناريو يتكون من تتابع مقنن للأحداث التي تُميز بعض المناسبات العامة كالذهاب إلى السينما أو إلى المطعم أو إلى الكوافير، وهذا المفهوم قريب جداً من مفهوم الإطار frame لملارفين مينسكي.والنقطة الرئيسية التي يقدمها شانك وأبيلسون هي أن معرفة السيناريو لمناسبات مختلفة شرط ضروري لفهم الطريقة التي تترابط بها الأحداث المختلفة لأي قصة. ويصف السيناريو العلاقات السببية بين الأحداث المختلفة، كما أنه يمكن الحاسب من التوصل إلى الاستنتاجات وتخمين الأشياء المتضمنة التي لم تُذكر صراحة، وملء الفراغات في القصة التي تروى كما يفعل القاريء البشري بالضبط بما في ذلك احتمال الخطأ.يوضح المثال التالي جزء من سيناريو لمطعم والذي يبين المحيط العام بينما يتكون الجزء الباقي من عدد من الأحداث الرئيسية: دخول الزبون، اختيار وطلب الطعام، الوجبة، دفع الحساب والانصراف،. ولاختيار وطلب الطعام ثلاث سيناريوهات فرعية حتى تناسب ظروفاً وحالات مختلفة.الموجودات: مناضد، قائمة الطعام، أطباق، نقود، فواتير الحساب...الأفراد:الزبائن، الجرسون، محصل النقود، المدير، الطباخ...شروط الدخول:* أن يكون الزبون جائعاً* ان يكون لدى الزبون نقودالنتيجة:* لدى الزبون نقود أقل مما كان لديه قبل الدخول* الزبون لم يعد جائعاً* الزبون سعيد (ربما)* مدير المطعم لديه نقود أكثر

برنامج لونار LUNAR

* وهو برنامج يعتمد على استخدام طريقة معروفة بـ شبكة الانتقال المعززة Augmented Transition Network ATN للتحاور مع قاعدة بيانات باللغة الطبيعية. وتتكون قاعدة البيانات هذه من معلومات عن عينات من صخور القمر والتي جمعها رواد فضاء من ناسا NASA.ويتم تحليل الأسئلة التي توجه للبرنامج على 3 مراحل:1. تحليل تركيبي، يبني شجرة الأعراب أو عدة شجرات إذا أمكن.2. تحليل دلالي للشجرة أو الشجيرات، يبني التمثيل الداخلي للاستفسار.3. الإستجابة للطلب المتضمن في التمثيل الداخلي للسؤال، وينطوي هذا على البحث عن المعلومات المطلوبة في السؤال وإعداد الرد باللغة الطبيعية.ويشمل البرنامج ما يقارب من 3500 كلمة بالإضافة لقواعد النحو. ويستطيع برنامج التحليل اللغوي أن يعرض فهماً محدوداً لعلاقة الضمائر بالأشياء التي ترجع إليها وكذلك الترتيبات المطمورة مثل العبارات الموصولة داخل الجملة الرئيسية.وقد كان لبرنامج لونار تأثير عظيم جداً على تطور برامج اللغات الطبيعية بسبب تقنيته المستخدمة لشبكة الانتقال المعززة ATN والتي أصبحت واحدة من أكثر الطرق شيوعاً في معالجة اللغات الطبيعية خلال السنوات العشر الماضية.ومن أمثلة الأسئلة التي يمكن أن يتناولها :1. ماهو متوسط تركيز الألمنيوم في صخور مرتفعة القلوية؟2. كم عدد العينات التي تحتوي على خامس أكسيد الفوسفور؟

أمثلة على برامج نحوية

* برنامج شردلوإن البرنامج الذي ظل مشهوراً في تاريخ الذكاء الإصطناعي هو برنامج شردلو بلاشك، الذي وضعه تيري وينوجراد في MIT. ويحاكي هذا البرنامج عمل إنسان آلي لديه القدرة على تناول عدة أشياء ذات أشكال متعددة مثل المكعبات والأهرامات الموضوعة على منضدة، ويمكنه أن يتحدث بلغة طبيعية مع شخص ما وأن يجيب على أسئلته حول هذه الأشياء. ولقد ضم وينوجراد في برنامجه قواعد لغوية مستمدة من النحو النسقي systemic grammer لهاليداي halliday وهو عبارة عن نظام من الشبكات المنطقية التي تُعبر عن خواص معينة للوحدات التركيبية خاصة لحالات الأفعال وأزمنتها وبنائها (للمعلوم والمجهول). وتستخدم بعض المعاني الدلالية أثناء التحليل اللغوي مما يؤدي إلى خفض عدد البناءات الممكنة للجملة عما لو طبقنا المعايير التركيبية وحدها.

مفهوم الذكاء الإصطناعي لفهم الجمل المنفصلة

ارتبطت بداية هذه المرحلة (حوالي عام 1970 م) بفقدان الأمل في إمكانية تمثيل لغة بأكملها داخل الحاسب وقصر الباحثون جهودهم على تراكيب لغوية محددة تتصل اتصالاً وثيقاً باختبارات التحليل الدلالي. وكان أول برنامجين يدلان على هذا التغير برنامجي شردلو اshrdlu لوينجراد ولونار Lunar لوود. وتتميز هذه المرحلة أيضاً بقصر هجف الفهم على الجمل المنفردة دون محاولة ربط هذه الجمل بنص كامل.وعادة ماينظم البرنامج الكامل لمعالجة اللغات الطبيعية بشكل graph، تُمثل فيه الأشكال البيضاوية المعلومات التي سيتم معالجتها، أما المستطيلات فتضم البرامج الفرعية التي تؤدي إلى التحويلات المطلوبة بين هذه الأشكال.وحيث أنه لا يوجد اتفاق عام على ماينبغي على التمثيل الداخلي أن يحتويه أو على ماهية معنى الجملة، فإن تقسيم معالجة اللغات الطبيعية إلى برامج فرعية يكون إختيارياً تماماً فيمكن أن تبدأ عملية الاستنتاج قبل أنتهاء عملية التحليل، علاوة على ذلك فليس بالضرورة أن يحتوي كل برنامج على خطوات استدلالية.فالمطلوب عادة من برنامج يستخدم اللغة الطبيعية لاستخلاص المعلومات من قاعدة البيانات أن يستخلص المعلومة الصحيحة، إلا أنه قد يوجد برنامج أكثر تقدماً لتأويل الاستفسارات الغامضة، ويفضل الباحثون أمثال كولون coulon وكايزر kayser مفهوم التفسير بدرجات مختلفة من العمق على التمثيل الداخلي.

معالجة اللغات الطبيعية

معالجة اللغات الطبيعية (بالانجلزية Natural Language Processing" NLP") هي علم فرعي من علوم الذكاء الاصطناعي والتي بدورها متفرعة من المعلوماتية، وتتداخل بشكل كبير مع علوم اللغويات التي تقدم التوصيف اللغوي المطلوب للحاسوب. هذا العلم يمكننا من صناعة برمجيات تتمكن من تحليل ومحاكاة فهم اللغات الطبيعية.
أولى الأنظمة مثل SHRDLU، التي عملت في بيئة محددة من الكلمات، عملت بشكل فعّال للغاية، مما قاد الباحثين إلى التفائل الشديد الذي تلاشى بسرعة عندما تم تطبيق الأنظمة في بيئات أكثر واقعية بوجود التعقيد والإبهام (عدم الوضوح) في اللغات التي يتداولها البشر.فهم اللغات الطبيعية يشار إليه أحيانا بمشكلة الذكاء الإصطناعي الكاملة، لأن تمييز وفهم اللغات الطبيعية يحتاج إلى معرفة مكثفة بالعالم الخارجي والقدرة على التحكم به. تعريف مفهوم "الفهم" هو واحد من المشاكل الرئيسية في معالجة اللغات الطبيعية.مثال على بعض المشاكل التي تواجه أنظمة فهم وتحليل اللغات الطبيعية:* جملة "أعطينا القردة الموزة لأنها كانت جائعة" وجملة "أعطينا القردة الموزة لأنها كانت ناضجة" لهما ذات التكوين القواعدي، ولكن الضمير "ها" في كلمة لأنها تعود في الأولى على القردة، وفي الثاني تعود على الموزة: ففهم الجملة بشكل صحيح غير ممكن دون معرفة خصائص الموز وسلوك القردة.

اللغة الطبيعية

اللغة الطبيعية هو مصطلح في علم اللسانيات يقصد بة اللغة البشرية التي يمكن للأطفال اكتسابها من أبائهم أو مربيهم بشكل عفوي دون تعليم أو إرشاد وأن يتعامل معها الناس كلغة أم ويطلق عليها حين إذ مصطلح "لغة حية".أما "لغة ميتة" أو "لغة منقرضة" فهو مصطلح يشير إلى لغة طبيعية لا يوجد لها متكلمون كلغة أم إلا في الماضي.اللغات الطبيعية تختلف عن اللغات الاصطناعية مثل اللغات الشكلية أو لغات البرمجة، أو عن الوسائل التواصلية الموجودة لدى الحيوانات من ناحية أخرى. وهناك أيضا "لغات ممنهجة" تم إبداعها بشكل اصطناعي تقليداً لللغات الطبيعية. من أشهر اللغات الممنهجة هي لغة إسبرانتو تم ابتداعها لتكون لغة دولية، أما اليوم فتعتبر لغة طبيعية إذ اكتسبها بعض الأطفال وبدؤوا يستخدمونها كلغة أم لهم.أغلبية اللغات الطبيعية هي لغات صوتية، بمعنى انها لغات يمكن لفظ كلماتها بصوت، ولكن توجد أيضا لغات إشارة وهي اللغات الطبيعية التي تـُعرض كلماتها عن طريق الإيماءات الجسدية والتي تطورت في مجتمعات فيها نسبة كبيرة من الصم.جميع اللغات الطبيعية تحتوي على نحو يمكن للناطق تشكيل سلاسل من الإشارات اللغوية. ومن بين الإشارات اللغوية المتوفرة للناطق توجد إشارات ليس لها معنى معينة، بل تستخدم لوصل الوحدات اللغوية وللإشارة إلى طبيعة هذا الوصل (كلمات مثل "الذي"، "أنّ" وغيرها) وكذلك إشارات ورثت معناها من إشارات أخرى. مثلاً، في جملة "زرت فرنسا وهي بلاد جميلة" ترث كلمة "هي" معناها من كلمة "فرنسا".حتى الآن لا يعلم العلماء عن جهاز تواصلي طبيعي يماثل اللغات الطبيعية ما عدا اللغات البشرية، لذلك تعتبر اللغة الطبيعية وإمكانية اكتسابها عفويا من أبرز مميزات البشر.

اللغة

اللغة نسق من الإشارات والرموز، يشكل أداة من أدوات المعرفة، وتعتبر اللغة أهم وسائل التفاهم والاحتكاك بين أفراد المجتمع في جميع ميادين الحياة. وبدون اللغة يتعذر نشاط الناس المعرفي. وترتبط اللغة بالتفكير ارتباطًا وثيقًا؛ فأفكار الإنسان تصاغ دومًا في قالب لغوي، حتى في حال تفكيره الباطني. ومن خلال اللغة فقط تحصل الفكرة على وجودها الواقعي. كما ترمز اللغة إلى الأشياء المنعكسة فيها.تنقسم لغات العالم إلى عائلات لغوية، كاللغات الأفريقية الآسيوية واللغات الهندية الأوروبية، حيث تحوي كل منها عددًا من اللغات ذوات الأصول والخصائص المتشابهة. قائمة اللغات حسب عدد متحدثيها: توضح أهم اللغات انتشارا.* اللغات الاصطناعية: تحاكي الأنظمة اللغوية التي تطورت طبيعيا خلال مدى زمني أطول.* لغات البرمجة: وهي أساليب معيارية لإيصال التعليمات إلى الحواسب* اللغويات: وهو علم دراسة اللغات البشرية: تاريخها، وبنائها نحوا وصرفا، ونظم الصوتيات والكتابة فيها.