پروژه یادگیری عامل های مصنوعی

پروژه یادگیری عامل های مصنوعی

پروژه یادگیری عامل های مصنوعی پژوهش کامل در حوزه کامپیوتر و IT میباشد و در 5 فصل تنظیم شده است. در این پایان نامه، نقش یادگیری به عنوان گسترش دسترسی طراح به محیط های ناشناخته توضیح داده شده است .شما میتوانید فهرست مطالب پروژه را در ادامه مشاهده نمایید.

پروژه بصورت فایل قابل ویرایش ورد(WORD) در 180 صفحه برای رشته کامپیوتر و IT در پایین همین صفحه قابل دانلود میباشد. شایسته یادآوری است که پروژه از ابتدا تا پایان ویرایش وتنظیم , سکشن بندی (section) ، نوشتن پاورقی (Footnote) و فهرست گذاری اتوماتیک کامل شده وآماده تحویل یا کپی برداری از مطالب مفید آن است.

چکیده

هدف اصلی از ارایه این پایان نامه، انتقال نظراتی است که در سالهای گذشته در تحقیقات مربوط به رشته یادگیری ماشین (زیر شاخه ای از هوش مصنوعی که بر روی برنامه هایی تمرکز می کند که از طریق تجربه به یادگیری می پردازند.) مطرح شده است. در ارایه این نظرات تلاش شده است که با حفظ دقت، از بیش از حد رسمی شدن پرهیز شود، هرجا که مناسب بوده الگوریتم های شبه برنامه نیز گنجانده شده تا نظرات را ملموس تر کند. به جای توضیح این زیر شاخه از هوش مصنوعی به سبک خاص خودش، سعی گردیده است تا تمام دانسته ها در این زمینه در یک چارچوب مشترک ارایه شوند. در این پایان نامه، نقش یادگیری به عنوان گسترش دسترسی طراح به محیط های ناشناخته توضیح وهمچنین نشان داده می شود که این نقش چگونه برای طراحی عامل ها محدودیت ایجاد می کند و از بازنمایی صریح دانش و استدلال پشتیبانی مینماید. این مبحث، روشهای تولید دانش مورد نیاز توسط اجزای تصمیم گیرنده را توصیف می کند، همچنین نوع جدیدی از این اجزاء (شبکه عصبی) را به همراه رویه های یادگیری مربوط به ان معرفی می نماید. بدین منظور به ترجمه بخش یادگیری از کتاب هوش مصنوعی راسل (فصول 18، 19، 20 و 21) مبادرت شده است. پنج مشخصه اصلی این پایان نامه عبارتند از: 1-ارایه دیدگاهی یکپارچه از رشته یادگیری ماشین. 2-تمرکز حول محور عاملهای هوشمند 3-پوشش جامع و به روز مطالب 4-تأکید یکسان هم بر مباحث نظری و هم عملی 5-درک مطالب از طریق پیاده سازی.

واژه های کلیدی:عامل هوشمند، یادگیری استقرایی، دانش قبلی، یادگیری اماری، شبکه های عصبی، یادگیری تقویتی

فهرست مطالب

مقدمه. 1

فصل یکم  یادگیری از طریق مشاهدات

1-1- اَشکال یادگیری.. 3

1-2-یادگیری استقرایی.. 6

1-3-یادگیری درختان تصمیم.. 8

1-4- یادگیری گروهی.. 24

1-5- چرا یادگیری درست عمل می کند : نظریه یادگیری محاسباتی.. 29

1-6 -خلاصه. 35

فصل دوم  دانش در یادگیری

2-1- یک تدوین منطقی از یادگیری.. 37

2-2- دانش در یادگیری.. 48

2-3-یادگیری مبتنی بر تشریح.. 52

2-4 - یادگیری با استفاده از ارتباط اطلاعات.. 58

2-5- برنامه نویسی منطقی استقرایی.. 63

2-6-خلاصه. 74

فصل سوم  روشهای یادگیری اماری

3-1- یادگیری اماری.. 77

3-2-یادگیری با داده های کامل.. 81

3-3-یادگیری با متغیرهای پنهان: الگوریتم EM... 91

3-4-یادگیری نمونه محور. 101

3-5- شبکه های عصبی.. 106

3-6-ماشین های کرنل.. 121

3-7-مطالعة موردی : تشخیص ارقام دست نویس.... 125

3-8-خلاصه. 128

فصل چهارم  یادگیری تقویتی

4-1-مقدمه. 132

4-2-یادگیری تقویتی غیر فعال.. 134

4-3-یادگیری تقویتی فعال.. 138

4-4-تعمیم در یادگیری تقویتی.. 145

4-5-خلاصه. 151

فصل پنجم  جمع بندی و نتیجه گیری

فهرست واژگان:157

منابع و مراجع.. 166

فهرست شکل ها

شکل 1-1- (الف) جفتهای مثال(X, f(X)) و یک فرض خطی و سازگار. (ب) یک فرض چندجمله ای درجه 7 و سازگار برای مجموعه داده یکسان . (ج) مجموعه داده متفاوتی که یک برازش چندجمله ای درجه 7 دقیق یا یک برازش تقریبی خطی را میپذیرد. (د) یک برازش سینوسی دقیق وساده برای مجموعه داده یکسان.6

شکل 1-2- درخت تصمیمی برای تصمیم درمورد این که ایا برای یک میز منتظر میمانیم یا خیر.10

شکل 1-3- مثالهایی برای دامنه رستوران.. 12

شکل 1-4-تقسیمبندی مثالها بهوسیله تست بر روی صفات.. 13

شکل 1-5- الگوریتم یادگیری درخت تصمیم.. 14

شکل 1-6- درخت تصمیمی که از مجموعه اموزشی مربوط به 12 مثال نتیجه شده است... 15

شکل1-7- منحنی یادگیری برای الگوریتم درخت... 19

شکل 1-8- تصویری از قدرت رسایی افزایش یافته که توسط یادگیری گروهی به دست امده است... 24

شکل 1-9-چگونگی کارکرد الگوریتم بوستینگ... 26

شکل1-10-گونه ADABOOSTروش بوستینگ درمورد یادگیری گروهی.. 27

شکل 1-11- (الف) نمودار نشان دهنده کارایی ریشه های تصمیمی با M=5 . (ب) نسبت درست بر اساس مجموعه اموزشی و مجموعه تست به عنوان تابعی از M... 28

شکل 1-12- نمای طرح واری از فضای فرض که نشان دهنده "ε–بال"اطراف تابع درست fاست... 30

شکل 1-13- یک لیست تصمیم برای مسأله رستوران.. 32

شکل 1-14-الگوریتمی برای یادگیری لیست های تصمیم.. 34

شکل 1-15- منحنی یادگیری برای الگوریتم یادگیری لیست تصمیم بر اساس داده های رستوران. منحنی یادگیری درخت تصمیم نیز برای مقایسه نشان داده شده است... 34

شکل 2-1-(الف) یک فرض سازگار. (ب) یک منفی کاذب. (ج) فرض تعمیم یافته است. (د) یک مثبت کاذب. (ه) فرض تخصیص یافته است... 40

شکل 2-2- الگوریتم یادگیری جستجوی بهترین فرض جاری.. 41

شکل 2-3- الگوریتم یادگیری فضای نمونه. این الگوریتم زیرمجموعه ای از Vرا مییابد که با مثالها سازگار باشد 43

شکل 2-4- فضای نمونه شامل تمام فرضهای سازگار با مثالها میباشد. 45

شکل 2-5- بسط های اعضای Sو G. هیچ مثال شناخته شده ای در بین دو مجموعه کران قرار نمیگیرد 46

شکل 2-6-یک فرایند یادگیری فزاینده در طول زمان از دانش زمینه اش استفاده میکند و به ان می‌ا‌فزاید 49

شکل 2-7- درختان اثبات برای مسأله ساده سازی.. 55

شکل 2-8- الگوریتمی برای یافتن یک تعیین کننده سازگار کمینه. 61

شکل 2-9- مقایسه کارایی بین RBDTLو DECISION-TREE-LEARNING براساس داده هایی که به طور تصادفی تولید شده اند و برای تابع هدفی که به تنها 5 صفت از 16 صفت بستگی دارد. 62

شکل2-10- مثال های مثبت و منفی ساختار اصلاح منطقی کد شده. 63

شکل 2-11-یک درخت خانواده معمولی.. 64

شکل 2-12- خلاصه ای از الگوریتم FOIL برای یادگیری مجموعه هایی از بندهای هورن.. 68

شکل 2-13- مراحل اولیه در یک فرایند تحلیل معکوس... 70

شکل 2-14-مرحله ای از تحلیل معکوس که یک گزاره جدید Pرا تولید می کند. 73

شکل3-1- احتمالات متعاقب از معادله(3-1)79

شکل 3-2-(الف)مدل شبکه بیزین برای حالتی که نسبت های لیمو و گیلاس ابنبات ها نامعلوم است. (ب) مدل بیزین برای حالتی که رنگ کاغذ ابنبات (به طور احتمالی) به طعم ان بستگی دارد. 82

شکل 3-3- منحنی یادگیری برای یادگیری خام بیزین که درمورد مسأله رستوران.. 84

شکل 3-4- یک مدل خطی گاوس... 86

شکل 3-5- مثالهایی از توزیعbeta [a, b] برای مقادیر مختلفی از [a, b].87

شکل 3-6- یک شبکه بیزین که مطابق با یک فرایند یادگیری بیزین میباشد. 89

شکل 3-7-(الف) یک شبکه تشخیص ساده برای بیماری قلبی (ب) شبکه معادل با حذف متغیر پنهانHeartDisease. 91

شکل 3-8-(الف) 500 نقطه داده در دو بعد، که وجود سه دسته را پیشنهاد میکنند. (ب) یک مدل ترکیبی گاوس با سه مؤلفه؛ وزنها (از چپ به راست) عبارتند از 0.2، 0.3 و 0.5. داده ها در (الف) از این مدل تولید شده بودند. (ج) این مدل با استفاده از داده های شکل (ب) توسط EMدوباره ساخته شده است... 93

شکل 3-9-نمودارها نشان دهنده لگاریتم درست نمایی داده ها به عنوان تابعی از تکرار EMمی باشند. 94

شکل 3-10-(الف)یک مدل ترکیبی برای ابنبات. نسبت های طعم های مختلف،کاغذها، و تعداد حفره ها به بسته بستگی دارند. (ب) شبکه بیزین برای یک حالت ترکیبی گاوس. میانه و کوواریانس متغیرهای قابل مشاهده (X)به مؤلفه Cبستگی دارند 96

جدول 3-1-تعداد هشت نوع اب نبات.. 97

شکل 3-11-شبکه بیزین پویا و گسترده ای که یک مدل پنهان مارکوف را بازنمایی می کند. 98

شکل 3-12- (الف) زیر نمونه ای متشکل از 128 نقطه از داده های موجود در شکل 3-8(الف) به علاوه دو نقطه مورد بررسی (ب) طراحی سه بعدی از ترکیب های گاوسی که داده ها تولید شده بودند. 103

شکل3-13- تخمین چگالی در مورد داده های شکل 3-12-(الف) با استفاده از k نزدیکترین همسایه. 103

شکل 3-14-تخمین چگالی کرنل برای داده های شکل 3-12-(الف)، که کرنلهای گاوسی را به ترتیب باw=0.02 ,0.07,0.20 به کار می برد. 105

شکل3-15- مدل ریاضی ساده ای برای یک عصب فعالیت خروجی.. 106

شکل 3-16- (الف) تابع فعالیت آستانه ای (ب) تابع دو هلالی.. 107

شکل 3-17-با مفروض داشتن ورودی مناسب و وزنهای بایاس، واحدها با وجود یک تابع فعالیت استانه میتوانند به صورت گیت های منطقی عمل کنند. 108

شکل 3-18-یک شبکه عصبی بسیار ساده با دو ورودی، یک لایه پنهان دو واحدی، و یک خروجی.. 109

شکل 3-19-(الف) یک شبکه پرسپترون متشکل از سه واحد خروجی پرسپترون (ب) نموداری از خروجی یک واحد پرسپترون دو ورودی با یک تابع فعالیت دوهلالی.. 110

شکل 3-20-تفکیک پذیری خطی در پرسپترونهای استانه. 111

شکل 3-21- الگوریتم یادگیری نزول گرادیان برای پرسپترونها113

شکل 3-22-مقایسه کارایی پرسپترونها و درختان تصمیم.. 113

شکل 3-23-(الف) نتیجه ترکیب دو تابع هموار استانه با رویه های مخالف به منظور تولید یک تابع مرز. (ب) نتیجه ترکیب دو تابع مرز برای به وجود اوردن یک برامدگی.. 115

شکل 3-24-یک شبکه عصبی چندلایه ای با یک لایه پنهان و 10 ورودی، که برای مسأله رستوران مناسب است 116

شکل 3-25-الگوریتم پس-انتشار برای یادگیری در شبکه های چندلایه ای.. 117

شکل 3-26-(الف) منحنی اموزشی برای مجموعه مفروضی از مثالها در دامنه رستوران، همانطور که وزنها در طول دوره های مختلف تغییر میکنند، نشان دهنده کاهش تدریجی در خطاست. (ب) منحنیهای یادگیری مقایسهای نشان میدهند که یادگیری درخت تصمیم کمی بهتر از پس-انتشار در یک شبکه چندلایهای است... 119

شکل3-27- (الف)یک مجموعه اموزشی دو بعدی (ب) داده های مشابه بعد از نگاشت یک فضای ورودی سه بعدی 122

شکل3-28- نمای نزدیک و تصویر شده ای به درون دو بعد اول از جداکننده بهینه. 122

شکل 3-29-مثالهایی از ارقام دست نویس که از پایگاه داده NISTبه دست امده اند. ردیف بالا: مثالهایی از ارقام 9-0 که تشخیص انها اسان است. ردیف پایین: مثالهای سخت تر از اعداد مشابه. 125

جدول 3-2- خلاصه نرخهای خطا و برخی از سایر مشخصههای هفت تکنیک مورد بحث... 128

شکل4-1- (الف) یک خط مشی π برای دنیای 3*4 (ب) سودمندی های حالت ها در دنیای 3*4 بامفروض بودن خط مشی π. 135

شکل4-2- یک عامل یادگیری تقویتی غیر فعال مبتنی بر برنامه ریزی.. 138

شکل4-3- منحنی یادگیری ADP غیرفعال برای دنیای3*4. 138

شکل 4-6-کارایی یک عامل ADPحریص که به اجرای اقدامی می پردازد که خط مشی بهینه برای مدل یادگرفته شده پیشنهاد می کند (الف) خطای RMSدر تخمین های سودمندی ای که روی نه مربع غیرپایانی میانگین گرفته شده اند. (ب) خط مشی تاحدی بهینه که عامل حریص در این دنباله خاص از ازمایشات به ان همگرا می شود. 140

شکل 4-7-کارایی عامل ADPاکتشافی که از R+=2و Ne=5 استفاده می کند. 142

شکل4-8- یک عامل Q- یادگیری اکتشافی.. 144

شکل4-9- وضعیت برای مساله تنظیم یک میله بلند روی یک ارابه متحرک... 150

شکل 4-10 تصاویری از یک هلیکوپتر خودمختار که در حال اجرای یک مانور دایره ای بسیار سخت می‌باشد 151



خرید و دانلود پروژه یادگیری عامل های مصنوعی