PDA

View Full Version : حرفه ای: edge detection



ila_mata86
دوشنبه 11 مرداد 1389, 10:24 صبح
سلام
می خواستم با شبکه های عصبی سلولی یک لبه یاب بنویسم. چون هوش رو هنوز پاس نکردم می خواستم دوستان در مورد مراحل اون، من رو راهنمایی کنند.
نکته : در مورد شبکه عصبی مطالبی خوندم و کمی با اون آشنا هستم.

مصطفی ساتکی
دوشنبه 11 مرداد 1389, 12:47 عصر
سلام .
قبلاً در موردش بحث شده:
http://www.barnamenevis.org/forum/showthread.php?t=214311
http://www.barnamenevis.org/forum/showthread.php?p=974743
http://www.eca.ir/forum2/index.php?topic=39992.0

ila_mata86
دوشنبه 11 مرداد 1389, 21:31 عصر
ممنون ولی این تاپیک ها رو قبلا دیدم و یه آشنایی جزیی پیدا کردم.
اگر میشه بیشتر توضیح بدید.
همان طور که بالا گفتم من هوش رو هنوز پاس نکردم به همین دلیل می خوام بدونم چه مراحلی رو باید انجام بدم تا بتونم یک لبه یاب با استفاده از شبکه عصبی سلولی رو پیاده سازی کنم.(مقاله، کتاب و ...)

مصطفی ساتکی
سه شنبه 12 مرداد 1389, 08:51 صبح
سلام.
به نظر من در ابتداي كارتون، پرو‍ژه سختي رو انتخاب كرديد شما براي پياده سازي اين مورد بايد تا حدود با پردازش تصوير و شبكه عصبي داشته باشيد .يعني شناختي از لبه ياب هاي رايج و عملكرد و مزايا و معايبشون و همچين عملكرد و خصوصيات شبكه متداول رو .
من براي پياده سازيش 150 مقاله در مورد cnn رو از IEEE گرفته و مطالعه كردم و پياده سازيش يك ماه طول كشيد.خيلي از اين مقاله ها در مورد پياده سازي cnn با mlp متدشون بيان كرده بودند ولي مشكل اينجا بود زمانيكه من با mlp پياده سازي cnn رو انجام دادم جواب مطلوب و مورد نظر رو تو اون پروژه به من نداد . جواب مطلوب جوابيه كه بتونه در شرايط عادي با Canny Edge Detector رقابت كنه. از جمله مزاياي canny يافتن لبه هاي مات در تصوير بخاطر طبيعت اين الگوريتمه كه براي يافتن لبه اي فرعي از منتها عليه لبه هاي اصلي استفاده مي كنه و از جمله معايبش وابسته بودن به 3 پارامتر Sigma , Threshold1 ,Threshol2 مي باشد كه تو سامانه هاي هوشمند اين يك ضعف بزرگه.يه با تغيير brightness و نويز در تصوير شما هيچ گونه پايداري از اين لبه ياب نمي بينيد و جواب هاي مختلفي رو به شما ميده. شما براي پياده سازي يه CNN خوب به نظر من در ابتدا با عملكرد Canny رو مطالعه كنيد در پياده سازي خيلي مي تونه بهتون كمك كنه.
پس از اينكه mlp جوابمو نداد تصميم به پياده سازي با شبكه هاي ديگر گرفتم. يكي از اين مقاله در مورد Search Engine هاي تصوير صحبت كرده بود و در اونجا به شبكه SOM اشاره شده بود از اونجايي كه نمونه هاي خروجيش رو در اونجا ديدم و مخصوصاً تصويري كه مثال زده بود تصاوير مبنا در پردازش تصوير بود كه همجا از اونها استفاده ميشه(بعنوان يه معيار) به همين جهت تصميم گرفتم Canny رو با SOM پياده كنم.
در واقع عملكرد كلي رو پايه Canny گذاشتم متد Clustring رو برپايه SOM . البته قابل ذكر كه شبكه من در حالت كلي هيچ شبيه SOM نيست فقط تك سلول هاي پايين خوشه همانند SOM‌عمل مي كنند.
تو انواع CNN ابتدا كاربر نمونه خودشو به شبكه آموزش ميده اين آموزش از طريق معرفي لبه هاي هدف مشخص ميشه. البته تو آموزش اين شبكه شما بايستي نكات ظريفي رو راحت كنيد .چون train در شبكه ها خودش هم نياز به تجربه داره تا جواب مطوب رو بدست بياريد.
از جمله كاربردهاي cnn پياده كردن ناحيه هدف مي باشد و سرعت بالا.البته سرعت بالا زمانيكه كه شما داده هاي بدست آمده در خروجي شبكه رو پردازش نكنيد در غير اينصورت سرعتش با لبه ياب canny يكسانه.
نكته آخر در پياده سازيشون دنبال toolbox و package آماده شبكه نريد چون كارتون با اونها را نمي افته.

ila_mata86
جمعه 22 مرداد 1389, 05:36 صبح
ممنون از راهنماییتون اگه میشه در مورد پياده سازي cnn با mlp یا SOM چند تا مقاله قرار بدید (در ضمن من canny و sobel و ... رو پیاده سازی کردم و تا حدودی با اون ها آشنا هستم ولی خوب بازم مبتدیم)

مصطفی ساتکی
جمعه 22 مرداد 1389, 08:14 صبح
براي مقاله بهترين سايت خود ieee كه كلمه cnn رو توش سرچ كنيد يه دوجين مقاله براتون مياره و بقيه هم به خودتون بستگي داره بخايد كه از كدوم شبكه استفاده كنيد.

ila_mata86
جمعه 22 مرداد 1389, 13:03 عصر
بله ولی ieee پولی و من هم دسترسی به اون ندارم می خواستم خواهش کنم اگه میشه چند تا مقاله خوب قرار بدید.

مصطفی ساتکی
جمعه 22 مرداد 1389, 21:34 عصر
سرعت اينترنتم پايينه .تو وب هم سرچ كنيد مقاله زياد پيدا ميشه.

ila_mata86
پنج شنبه 18 شهریور 1389, 15:20 عصر
دوست عزیز یک سوال در مورد شبکه عصبی سلولی داشتم:
باتوجه به فرمول که برای هر سلول cnn هستA,B,Z چی هستند؟(می دونم ماتریس هستند منظورم این هست که B یک فریم از عکس ورودی است مثلا 3*3؟ و همچنین A یک ماسک هست که تغییر می کنه؟اگر نه چی هستند و کجا بدرد می خوره و این که از عکس ورودی چطور استفاده میشه؟)

ila_mata86
پنج شنبه 18 شهریور 1389, 15:25 عصر
در ضمن منظور از (X(i,j یک پیکسل از تصویر هست ؟
و این که y و u چی هستند و کاربردشون چیه؟

ila_mata86
شنبه 20 شهریور 1389, 11:31 صبح
دوستان خواهشا نظر بدن.
باتوجه به این شکل جواب سوالاتی که در پست قبل پرسیدم رو کسی می تونه بگه:
http://artificial.ir/intelligence/attachments/3219d1284134081-gui-jpg

اگه اطلاعاتی که گذاشتم کمه بگید تا کامل کنم.
بازم خواهش می کنم کمک کنین خیلی گیرم.

ila_mata86
چهارشنبه 24 شهریور 1389, 14:12 عصر
معماری شبکه عصبی سلولی به صورت زیر است:
http://barnamenevis.org/forum/attachment.php?attachmentid=56386&stc=1&d=1284545307

asefy2008
شنبه 03 مهر 1389, 10:29 صبح
اول ازهمه بگم كه اطلاعاتم كامل و شايد درست هم نباشه.
نگاه كن cnn يك معماري هست كه با مثلا MLP يا SOM پياده سازي ميشه.
u ورودي يا همون عكستون هست و y هم خروجيتون . A و B هم دو ماتريس هست كه هردوشون مي تونند ماسك باشن ولي اونطور كه من در مقاله هاي مختلف و يك پرو‍‍‍‍ژه ديدم A يك ماسك هست و B با يك فريم از عكس conv ميشه البته وقتي ميگن B كلا صفر هست يعني B يك فريم از عكس هست z هم مي تونه صفر باشه.
موفق باشي