--انواع یادگیری برای شبکه های عصبی:
1.یادگیری با ناظر
در یادگیری با ناظر به قانون یاد گیری مجموعه ای از زوجهای داده ها به نام داده های یادگیری (Pi,Ti)i={1 … l } می دهند که در آن Pi ورودی به شبکه و Ti خروجی مطلوب شبکه برای ورودی Pi است. پس از اعمال ورودی Pi به شبکه عصبی در خروجی شبکه ai با Ti مقایسه شده و سپس خطای یادگیری محاسبه و از آن در جهت تنظیم پارامترهای شبکه استفاده می شود به گونه ای که اگر دفعه بعد به شبکه همان ورودی Pi اعمال شود خروجی شبکه به Ti نزدیکتر می گردد با توجه به این نکته که معلم سیستمی است که بر محیط وقوف دارد ( مثلا می داند که برای ورودی Pi خروجی مطلوب Ti است ).توجه داریم که محیط برای شبکه عصبی مجهول است . در لحظه k بردار ورودی Pi(k) با تابع توضیع احتمال معینی که برای شبکه عصبی نا معلوماست انتخاب و بطور همزمان به شبکه عصبی و معلم اعمال می شود . جواب مطلوب Ti(k) نیز توسط معلم به شبکه عصبی داده می شود . در حقیقت پاسخ مطلوب پاسخ بهینه ای است که شبکه عصبی برای ورودی مفروض باید به آن برسد . پارامترهای شبکه عصبی توسط دو سیگنال ورودی و خطا تنظیم می شود.به این صورت که پس از چند تکرار الگوریتم یادگیری که عموما توسط معادله تفاضلی بیان می شودبه پارامترهایی در فضای پارامترهای شبکه همگرا می شوند که برای آنها خطای یادگیری بسیار کوچک است و عملا شبکه عصبی شبکه عصبی معادل معلم می شود . یا به عبارتی دیگر اطلاعات مربوط به محیط (نگاشت بین TiوPi )که برای معلم روشن است به شبکه عصبی منتقل می شود و پس از این مرحله عملا می توان بجای معلم از شبکه عصبی استفاده کرد تا یادگیری تکمیل شود .
--2.یادگیری تشدیدی:
یک اشکال یادگیری با ناظر این است که شبکه عصبی ممکن است بدون معلم نتواند مواضع جدیدی را که توسط مجموعه داده های جدید تجربی پوشانده نشده است یاد بگیرد . یادگیری از نوع تشدیدی این محدودیت را برطرف می کند . این نوع یادگیری بطور on-line صورت می گیرد در حالی که یادگیری با ناظر را به دو صورت on-line & off-line می توان انجام داد. در حالت off-line می توان از یک سیستم محاسب با در اختیار داشتن داده های یادگیری استفاده کرد و طراحی شبکه عصبی را به پایان رساند . پس از مرحله طراحی و یادگیری شبکه عصبی به عنوان یک سیستم استاتیکی عمل می کند . اما در یادگیری on-line شبکه عصبی همراه با خود سیستم یادگیر در حال انجام کار است و از این رو مثل یک سیستم دینامیکی عمل می کند .
یادگیری از نوع تشدیدی یک یادگیری on-line از یک نگاشت ورودی-خروجی است . این کار از طریق یک پروسه سعی و خطا به صورتی انجام می پذیرد که یک شاخص اجرایی موسوم به سیگنال تشدید ماکزیمم شود و بنابر این الگوریتم نوعی از یادگیری با ناظر است که در آن به جای فراهم نمودن جواب واقعی ، به شبکه عددی که نشانگر میزان عملکرد شبکه است ارایه می شود. این بدین معنی است که اگر شبکه عصبی پارامترهایش را به گونه ای تغییر داد که منجر به یک حالت مساعد شد آنگاه تمایل سیستم یادگیر جهت تولید آن عمل خاص تقویت یا تشدید می شود . در غیر این صورت تمایل شبکه عصبی جهت تولید آن عمل خاص تضعیف می شود . یادگیری تقویتی مثل یادگیری با ناظر نیست و این الگوریتم بیشتر برای سیستمهای کنترلی کاربرد دارد .
--3. یادگیری بدون ناظر
در یادگیری بدون ناظر یا یادگیری خود سامانده پارامترهای شبکه عصبی تنها توسط پاسخ سیستم اصلاح و تنظیم می شوند . به عبارتی تنها اطلاعات دریافتی از محیط به شبکه را برداغرهای ورودی تشکیل می دهند. و در مقایسه با مورد بالا (یادگیری با ناظر) بردار جواب مطلوب به شبکه اعمال نمی شود . به عبارتی به شبکه عصبی هیچ نمونه ای از تابعی که قرار است بیاموزد داده نمی شود . در عمل می بینیم که یادگیری با ناظر در مورد شبکه هایی که از تعداد زیادی لایه های نرونی تشکیل شده باشند بسیار کند عمل می کند و در این گونه موارد تلفیق یادگیری با ناظر و بدون ناظر پیشنهاد می گردد .
2-4- زمینهای در مورد perceptron
Perceptron های ساده
یک خانواده ساده از شبکههای عصبی مدل perceptron میباشد. در یک دستهبندی تکخروجی، تعداد n ورودی و یک خروجی دارد . با هر ورودی یک ضریب وزنی Wi و با هر خروجی یک مقدار آستانه q مرتبط است.
Perceptron به گونه زیر عمل میکند:
ورودیهای Perceptron یک بردار ورودی از n مقدار حقیقی است.
Perceptron مجموع وزنها را محاسبه میکند a= ه Wi.Xi. این مقدار با مقدار آستانه q مقایسه میشود. اگر این مقدار از مقدار آستانه کوچکتر باشد خروجی 0 است و در غیر این صورت 1 است.
قدرت Perceptron
به وسیله تنظیم اعداد ورودی، وزن آنها و مقدار آستانه میتوان یک Perceptron برای انجام نسبتا خوب محاسبات گوناگون طراحی کرد. برای مثال توابع منطقی بولین مانند AND ، OR و NOT را میتوان به وسیله Perceptron طراحی کرد و هر مدار منطقی دیگر را به وسیله گیتهای AND و NOT یا AND و OR طراحی کرد. دستههای زیادی از Perceptronها ممکن است خروجیهای دستههای دیگر را به عنوان ورودی خود درخواست کنند.
به عنوان مثالی ازPerceptron ها میتوان یک تشخیص دهنده قالب متن را نام برد. حرفA درآرایهای 5*5 بهرمز درمیآید(encode میشود). این متن(حرف) بهوسیله یک Perceptron با 25 ورودی تشخیص داده میشود که در آن وزنها مقادیری برابر با مقادیر عددی داخل آرایه را میگیرند و مقدار آســتانه برابر است با: e-25 =q که در آن 0 < e < 1 .
خروجی Perceptron 1 است اگر و فقط اگر ورودی آن از 1 و 1- هایی باشد که عینا در آرایه آمده است.
دنبالههای Perceptron
یکی از خصوصیات جالب Perception این است که آنها میتوانند به وسیله مثالهای مثبت و منفی ( صحیح و اشتباه) برای انجام توابع دستهبندی شده مخصوص بارها مرتب شوند.
حال به یک مثال ساده از Perceptron با دو ورودیX1 وX2 ، که تشخیص میدهد که کدامیک از دو کلاس، عناصر متعلق به خودش را دارد. ما فرض میکنیم که این Perceptron دو طرح از کارکترهای چاپ شده از یک متن را بررسی کند، خروجی 1 است اگر و فقط اگر کاراکتر رقم 8 باشد. فرض کنیم که X1 بیانگر تعداد حفرههای کاراکتر است و X2 درجه راستی سمت چپ کاراکتر را نشان میدهد. ما با 4 ورودی .
اگر ما perceptron را در اول کار با وزنهایی برابر 0 و مقدار آستانه را برابر 10 مقداردهی کنیم یک ردهبندی از همه مثالهای منفی انجام دادهایم. با قرار دادن ردهبندیهای نادرست از 8 ، مقادیر ورودی از مثال 8 با بعضی فاکتورها مثل d جمع میشوند و تولیدات جدید با وزنهای متناظر با ایجاد میشوند.
فرض کنیم 1=d پس وزن ورودیها از 0 به 1 و 2 رشد پیدا میکند. حال در اینجا 5 = a به دست میآید که هنوز از مقدار آستانه 10 کوچکتر است. مثال هنوز به ردهبندی صحیحی نرسیده است واین قدم دنباله باید تکرار شود. بعد از دو قدم وزنها برابر 2 و 4 میشوند که مقدار 10 = a را نتیجه میدهد که برابر مقدار آستانه است و مثال مثبت از 8 به طور صحیح دستهبندی شده است. از آنجا که ضرایب وزنی تغییر کرده بودند لازم است که در همه مثالها ردهبندیها بازنشان ( Reset ) شوند. این را میتوان به سادگی دید که مثال B ردهبندی نادرستی است زیرا با وزنهای 2 و 4 داریم 24 = a ولی این حرف مورد نظر ما نیست، چون این مرحله را پیش رفتهایم لازم است که d.1 از W1 و d.2 از W2 کم شود تا ردهبندی نادرستی از B ثابت شود. به هر حال یک ردهبندی از 8 را دوباره بیرون میدهد.
بعدها موقع بروز خطا ما وزنها را برای درست کردن خطاهای ردهبندی اصلاح میکنیم. اگر مثالها دارای خاصیت صحیحی باشند وزنها در مجموعهای از مقادیری که به درستی روی هر ورودی کار میکنند قرار میگیرند.
قضیه بنیادی دنبالهها:
یک خصوصیت قابل توجه perceptron این است که آنها میتوانند دنبالهای از ردهبندی صحیح مثالهای مثبت ومنفی باشند.
فرض کنیم: X = X+ ب X-
X+ : مجموعهای از مثالهای مثبت
X- : مجموعهای از مثالهای منفی
گوییم که رشته بیکران S x= X1 , X2 , …, Xk ,… یک رشته متوالی(ترتیبی) برای X است در صورتی که هر Xi یک مثال در X است و هر عنصر از X اغلب به طور نامحدود در Sx رخ میدهد(نمایان میشود).
فرض کنیم Wk ضریب وزنی در سطح k دنباله باشد. وزن اولیه میتواند به صورت قراردادی باشد (برای مثال W1=0 ). حال رشته استاندارد حاصله، وزنها را به صورت زیر ارتقا میدهد:
بسته به استرادژی مورد نظر ممکن است مقادیر C k همگی یکسان باشند یا ممکن است با k تغییر کنند.
قضیه 1)
باشد و یک بردار حل وزنها برای X وجود داشته باشد, در این صورت رویه رشته استاندارد باید بعد از یک تعداد فرض کنیم یک مجموعه از رشته نمونه X و هر رشته ترتیبی برای آن داریم, اگر Ck یک ثابت مثبت مراحل مشخص یک راهحل پیدا کند به طوری که اگر برای بعضی k0 ها داشته باشیم:
WK0 = WK0+1 = WK0+2 = …
که WK0 یک راهحل برای X است.
بنابراین ما میتوانیم با استفاده از شبکههای عصبی هر چه بیشتر به شبیهسازی انسان توسط کامپیوترها نزدیک شویم به منظور واگذاری کارهای تکراری, وقتگیر و مسائلی که با توجه به پیشرفت بشری دیگر درخور بشر نیست.
منابع:
1- Why neural networks?
written by Dimitrios Siganos
Artificial neural networks
written by Robert J.Schalkoff
Artificial Intelligence
پایان