Tip:
Highlight text to annotate it
X
جيد أن نعرف بعض المصطلحات..
شائعة الاستخدام في الذكاء الاصطناعي لنميز انواع مختلفة من المسائل.
اول كلمة سأشرحها لكم هي fully observable (واضح كلياً) عكس partially observable (واضح بشكل جزئي- ضبابي).
بيئة تسمى fully observable واضحة اذا عميلك استطاع استشعار..
عند نقطة ما أنها كافية تماماً لوضع قرار مثالي.
على سبيل المثال، في عدة العاب ورقية ...
عندما تكون كل الأوراق على الطاولة، معرفة موضع هذه الأوراق ..
جدا واضح لأخذ الاختيار المثالي.
في الجهة المقابلة أو المعاكسة للبيئات الأخرى عندما تحتاج ذاكرة ..
من جهة العميل لتضع قرار معقول.
على سبيل المثال، لعبة البوكر، الأوراق ليست مفتوحة على الطاولة..
وتذكر الحركة السابقة لانتقالها سيساعدك لوضع قرار أفضل.
لفهم الاختلاف، تمعن تفاعل العميل..
مع البيئة إلى مستشعراته و آليات التنفيذ..
حيث أن هذا التفاعل يمر على عدة دورات..
عادة يسمى دورة التصور العملي.
في عدة بيئات ، انه من المناسب ان تعتبر..
أن البيئة لها بعض سمات من الحالة الداخلية.
على سبيل المثال، في اللعبة الورقية عندما تكون الاوراق ليست مفتوحة على الطاولة،
الورقة المترقبة أو المطلوبة قد تكون بين الاوراق التي في يدك.
بيئة واضحة اذا كانت المستشعرات تستطيع رؤية ..
حالة البيئة كلياً.
بيئة ضبابية إذا المستشعرات تسطيع رؤية جزء من الحالة فقط .
مع ذلك تذكر سلسلة التحركات السابقة يعطينا معلومات اضافية عن الحالة..
التي ليست مقرؤة بوضوح حالياً.
لذلك أي لعبة على سبيل المثال، عندما تكون الحركات السابقة لها دلالات عن..
ماذا قد يكون في في يد الشخص، هذه الالعاب تعتبر بيئة ضبابية..
وتتطلب معاملات مختلفة.
عادة العملاء الذين يتعاملوا مع البيئات الضبابية...
يحتاجوا إلى اكتساب ذاكرة داخلية لفهم ماهي...
حالة البيئة ، وسنتكلم بتوسع ..
عندما نتطرق لـ نماذج Markov "ماركوف"، أن هذه البنية..
لها ذاكرة داخلية.
المصطلح الثاني الذي يتعلق بالبيئات من حيث ماهية البيئة
هو deterministic (محددة) أو stochastic (احتمالية).
بيئة محددة إذا العميل يستطيع أن
يحدد المخرجات والنتائج بشكل بشكل ملحوظ.
مثلاً: في الشطرنج، ليس هناك عشوائية عند تحريك قطعة شطرنج.
فالموضع الجديد للقطعة محدد سلفاً.
ولا يشكل فرقاً الى اي مكان سأحرك نفس القطعة ، فالنتيجة واحدة.
هذا يسمى deterministic (بيئة محددة).
العاب النرد مثل:backgammon (لعبة طاولة الزهر) تعتبر stochastic (بيئة احتمالية).
حيث مايزال باستطاعتك تحديد مكان تحريك القطع..
لكن نتيجة الآداء ستتأثر أيضاً برمي النرد...
ولا يمكن تنبؤ ذلك.
يمكن حصر القيم العشوائية من رمي النرد..
لذلك نسميها stochastic (احتمالية).
مصطلح آخر discrete (متقطع) مقابل continuous (متصل).
بيئة متقطعة discrete environment إذا كانت خيارات ردة الفعل محدودة..
وعدة أشياء محدودة تستطيع ادراكها.
على سبيل المثال، في الشطرنج، يوجدة عدد محدود من الاماكن في اللوح...
وأشياء محدودة يمكنك فعلها.
بعكس البيئة المتصلة continuous environment
عندما يكون مجال ردات الفعل الممسموحة أوالاشياء التي تدركها غير محدودة أو لا منتهية.
على سبيل المثال، إذا رميت سهام، يوجد عدد لا نهائي من السبل لتصويب السهام
..
أخر مصطلح، سنميز بين البيئات الحميدة benign والخصومية adversarial .
في البيئات الحميدة benign، البيئة قد تكون عشوائية.
قد تكون احتمالية stochastic، لكن ليس فيها اهداف..
تناقض الاهداف الخاصة.
هذا على سبيل المثال عندما تكون benging .
قد تكون عشوائية. قد تؤثر في مخرجات ونتائج ردة أفعالك.
لكن ليس هناك من يهزمك.
بعكس البيئة الخصومية adversarial environment كالعديد من الألعاب مثل الشطرنج..
عندما يكون خصمك موجود ليهزمك.
مما يجعل هذه البيئة أكثر صعوبة في ايجاد ردة أفعال جيدة..
عندما خصمك يراقبك بنشاط ويتصدى لأي شيء تريد احرازه...
بالنسبة للبيئة الحميدة benign environment التي قد تكون مجرد احتمالية.
لكنه لا جدوى من جعل حياتك أسوأ..
لذلك دعونا نرى إلى مدى يمكنك أن تستوعب هذه التعبيرات...
بالانتقال الى الاختبار التالي.
هنا 4 مفاهيم : partially observable versus fully ضبابي الوضوح مقابل واضح كليا
stochastic versus deterministic احتمالي مقابل محدد ، continuous versus discrete متصل مقابل متقطع
adversarial versus benign خصومي مقابل حميد.
ودعوني اسألكم عن لعبة الداما checkers
اختر واحدة أو كل من الصفات التي تنطبق عليها.
فإذا تعتقد ان الداما partially observable بيئة ضبابية ..اختر هذه.
إذا لا .. فلا تخترها.
اذا تعتقد أنها stochastic احتمالية، اختر هذه،
continuous متصلة، اختر هذه... adversarial خصومية، اختر هذه.
اذا لا تعرف checkers الداما، ابحث في الويب وقوقل.
لتجد معلومات اكثر عن الداما.