معرفی پایگاه داده Apache Cassandra #
کاساندرا (Apache Cassandra) یک پایگاه داده منبع باز NoSQL متعلق به بنیاد نرم افزار آپاچی است. این یک پایگاه داده wide-column database است که به شما امکان می دهد داده ها را در یک شبکه توزیع شده ذخیره کنید. با این حال، برخلاف MongoDB، کاساندرا یک معماری masterless دارد و در نتیجه، به جای یک نقطه، چندین نقطه شکست دارد.
نسبت به تئوری CAP، کاساندرا یک پایگاه داده AP است یعنی در دسترس بودن و تحمل پارتیشن را ارائه میکند، اما همیشه نمیتواند یکپارچگی را ارائه دهد. از آنجا که Cassandra معماری masterless دارد، همه گره ها باید به طور مداوم در دسترس باشند. اما، Cassandra با مجاز دانستن نوشتن در هر گره در هر زمان و تطبیق ناسازگاریها در سریعترین زمان ممکن، در نهایت سازگاری را فراهم میکند.
کاساندرا با توزیع پذیری که دارد، قدرت و انعطاف پذیری بالایی را فراهم می کند. “توزیع شده” به این معنی است که Cassandra می تواند روی چندین ماشین اجرا شود در حالی که برای کاربران به عنوان یک کل یکپارچه ظاهر می شود. اجرای Cassandra بهعنوان یک گره یا نود تنها فایدهای ندارد، اگرچه انجام این کار برای کمک به شما برای سرعت بخشیدن به نحوه عملکرد آن بسیار مفید است. اما برای به دست آوردن حداکثر سود از کاساندرا، آن را روی چندین ماشین اجرا کنید.
دانستن مفهوم primary key کلید فهمیدن Apache Cassandra است
در Apache Cassandra، داده ها به طور خودکار توزیع می شوند، با استفاده از پارتیشن بندی انجام می شود. هر گره دارای مجموعه خاصی از توکن یا نشانه ها است و Apache Cassandra داده ها را بر اساس محدوده این نشانه ها در سراسر کلاستر یا خوشه توزیع می کند. کلید پارتیشن وظیفه توزیع داده ها بین گره ها را بر عهده دارد و برای تعیین محل داده ها مهم است. هنگامی که داده ها در خوشه درج می شوند، اولین مرحله اعمال یک تابع هش بر روی کلید پارتیشن است. خروجی تابع هش، برای تعیین اینکه چه گرهی (بر اساس محدوده نشانه) داده را دریافت می کند استفاده می شود.
بر اساس تعداد نودها، دامنه شماره توکنی که هر نود می تواند بگیرد بر اساس دامنه نوع داده long مشخص می شود. هر کلید پارتیشن به یک تابع هش یا Hash Function داده می شود و خروجی تایع هش مشخص می کند که توکن داده موردنظر چه شماره ای است. در این حالت گره یا نود هماهنگ کننده، مشخص می کند که کدام نود، آن دامنه از توکن را دریافت می کند. بنابراین داده روی نود مرتبط می نشیند. البته بر اساس ضریب تکرار یا RF ، تعداد نودهای بعدی حلقه در جهت عقربه های ساعت که باید یک تکرار از داده را روی خود جای دهند مشخص شده و تکرارهای داده بر روی نودهای مرتبط می نشیند.
جزییات بیشتر در مورد Apache Cassandra عملکرد را می توانید در سایت آن یا هر سایت معتبر دیگری دراینترنت جستجو کنید. همچنین در صورت تمایل می توانید دوره های آموزشی مرتبط آنلاین را نیز مشاهده نمایید. یک نمونه رایگان آن که البته انتقاداتی نیز به آن وارد است را می توانید در سایت Great Learning مشاهده نمایید.