PDA

View Full Version : فرق nosql وhadoop



amirreyhaneh
جمعه 15 اسفند 1393, 11:45 صبح
با سلام واحترام
یه سوال ابتدائی دارم.
فرق nosql وhadoop چیست؟
با تشکر

مبین رنجبر
جمعه 15 اسفند 1393, 16:39 عصر
با سلام واحترام
یه سوال ابتدائی دارم.
فرق nosql وhadoop چیست؟
با تشکر

به طور خلاصه NoSQL به مجموعه پایگاه داده های غیررابطه ای گفته می شود ولی Hadoop اصلا پایگاه داده نیست. Hadoop در واقع یک فریم ورک یا مجموعه ای از نرم افزارها و کتابخانه هایی است که ساز و کار پردازش حجم عظیمی از داده های توزیع شده را فراهم میکند. در واقع Hadoop رو میشه به یک سیستم عامل تشبیه کرد که طراحی شده تا بتواند حجم زیادی از داده ها را بر روی ماشین های مختلف پردازش و مدیریت کند و NoSQL را به نرم افزارهای نصب شده بر روی آن. در بین کتابخانه های هادوپ و به عنوان زیرپروژه های اون میشه به پایگاه های داده ای HBase و Cassandra اشاره کرد که جزو پروژه هادوپ و یکی از پایگاه های داده ای NoSQL می باشند.

amirreyhaneh
جمعه 15 اسفند 1393, 20:21 عصر
سلام مجدد-بسیار ممنون ومتشکر از پاسخ ساده وکامل شما
آیا هر پایگاه داده No sql از hadoop استفاده می کند یا فریم ورک دیگری می تواند داشته باشد؟مثلاً CouchBase از هادوپ استفاده میکنه؟

مبین رنجبر
جمعه 15 اسفند 1393, 20:41 عصر
سلام مجدد-بسیار ممنون ومتشکر از پاسخ ساده وکامل شما
آیا هر پایگاه داده No sql از hadoop استفاده می کند یا فریم ورک دیگری می تواند داشته باشد؟مثلاً CouchBase از هادوپ استفاده میکنه؟

نمیتونم قطعا بگم که همه پایگاه های داده NoSQL رو میشه به هادوپ ارتباط داد و اتصال داد ولی میشه مثال های زیادی حتی از پایگاه های داده ای رابطه ای مثل Oracle و یا MySQL زد که می توانند با هادوپ کار کنند. در واقع اکثریت اونها از زیرپروژه Apache Sqoop استفاده میکنند که می توان به طور مثال Couchbase ، MySQL و Oracle رو به اون ارتباط داد.

برای اتصال Couchbase به هادوپ باید کانکتور مخصوص خودش رو از سایتش دانلود کنید:
http://docs.couchbase.com/admin/hadoop/hadoop-1.2.html

در ضمن من راهنمای کامل(البته به انگلیسی) اتصال Couchbase به هادوپ رو به دلیل اینکه دانلود از سایت IBM در ایران تحریم هست قرار دادم که میتونید استفاده کنید.

cups_of_java
شنبه 16 اسفند 1393, 09:36 صبح
یه چیزی که دوست دارم اضافه کنم اینه که اکوسیستم هدوپ به منظور پردازش وسیع دیتای خیلی بزرگ و دراوردن اطلاعات از تو اون بوجود امده و استفاده میشه.
موج NoSQL هم تو همین راستا تقریبن بوده اما بیشتر به منظور داشتن دیتابیس هایی که بتونن تو شرایط امروزی بار دیتای بزرگ رو هندل کنن بوجود اومدن.

این دو تا اساسن یه فرقی دارن دیگه و اون اینه که اولی برای پردازش و نه ماندگاری دیتا و دومی برای ماندگاری و نگهداری دیتا استفاده میشن. هرچند که از دیتابیس های noSQl برای آنالیتکز و پردازش دیتا و map/reduce استفاده میشه. شاید در حجم های پایین تر و علت این موضوع اینه که این ها دیتابیس هستن اما هدوپ دیتا رو از روی فایل سیستم میخونه.