PDA

View Full Version : آیای NoSQL برای داده زیاد مناسبه ؟



amirali0079
سه شنبه 23 تیر 1394, 00:18 صبح
سلام دوستان من میخواستم بدونم بهترین دیتابیس برای پردازش اطلاعات زیاد مثلا 200هزار کاربر داریم هر کدوم حداقل 5 تا فیلد میخوان چیه
راستی اگه به زبان پایتون هم متصل بشه عالیهه
ممنون
ببخشید عنوان بده :D

golbafan
سه شنبه 23 تیر 1394, 00:26 صبح
پارامترهای زیادی در انتخاب دیتابیس سهیمه
شما برای چه نوع پروژه ای میخواهید کار کنید؟

به این سایت سر بزن:
http://db-engines.com/en/ranking

cups_of_java
سه شنبه 23 تیر 1394, 07:18 صبح
200 هزار اصلن عدد بزرگی نیست. تقریبن هر دیتابیس موجود در دنیا بهتون جواب میده

مبین رنجبر
چهارشنبه 24 تیر 1394, 13:46 عصر
سلام دوستان من میخواستم بدونم بهترین دیتابیس برای پردازش اطلاعات زیاد مثلا 200هزار کاربر داریم هر کدوم حداقل 5 تا فیلد میخوان چیه
راستی اگه به زبان پایتون هم متصل بشه عالیهه
ممنون
ببخشید عنوان بده :D

با ۲۰۰ هزار کاربر که همه اونها ۵ فیلد یکسان دارن بهرین انتخاب همون دیتابیس های رابطه ای مثل MySQL و... هستن.

-سیّد-
پنج شنبه 25 تیر 1394, 12:03 عصر
در تکمیل صحبت‌های دوستان:
بزرگ‌ترین استفاده‌کنندگان پایگاه‌های داده‌ای NoSQL امثال گوگل و فیس‌بوک و اینها هستند، که عدداشون در مقیاس پتابایت هست، یعنی ۱,۰۰۰,۰۰۰ گیگابایت! حالا شما خودت ببین توی اون مقیاس (یا حداقل یه کم نزدیک به اون مقیاس، مثلاً در حد ده یا صد ترابایت) قرار می‌گیری؟ اگه نه، شدیداً توصیه می‌کنم به سمت پایگاه‌های داده‌ای NoSQL نیای، چون پیچیدگیشون به مراتب بالاتر از پایگاه‌های داده‌ای رابطه‌ای هست (علاوه بر این که بعضی امکاناتی که پایگاه‌های داده‌ای رابطه‌ای به شما می‌دن توی NoSQL یا نیست، یا به سختی در دسترس هست، مثل join زدن، و همچنین در شرایط یکسان، performance پایگاه‌های NoSQL به مراتب پایینتر از performance پایگاه‌های داده‌ای رابطه‌ای هست).

امثال گوگل به دلایل مختلفی از این نوع پایگاه‌های داده‌ای استفاده می‌کنن (و در واقع خودشون جزو طراحان و سازندگان و توسعه‌دهندگان این نوع پایگاه‌ها بودن). یکیش اینه که داده‌شون انقدر حجیم هست که با پایگاه‌های داده‌ای رابطه‌ای کارشون راه نمی‌افتاده. یکی دیگه‌اش اینه که داده‌شون sparse هست، یعنی تعداد ستونهاشون به شدت زیاد هست (مثلاً یک میلیون ستون) که برای هر رکورد، فقط تعداد محدودی از این ستون‌ها مقدار دارن. اگه این داده رو بخوای توی SQL ذخیره کنی، جدولت پر می‌شه از مقادیر NULL و به شدت حجمش بالا می‌ره و غیر قابل استفاده می‌شه.

البته ناگفته نماند که گوگل پایگاه داده‌ای به نام Spanner طراحی کرده که شبه رابطه‌ای هست و امکانات مقیاس بالایی که خودش نیاز داشته رو هم براش فراهم کرده:
http://research.google.com/archive/spanner.html
https://en.wikipedia.org/wiki/Spanner_%28database%29
http://wired.com/2012/11/google-spanner-time/all