تاریخچه
پایگاه دادهها در اولین روزهای پیدایش محاسبات الکترونیک به کار گرفته شدند.
اما اکثر آنها برنامههای سفارشیای بودند که برای دستیبابی به پایگاه دادههای سفارشی نوشته میشدند .
این سیستمها بر خلاف سیستمهای مدرنی که میتوانند در پایگاه دادههای مختلف به کار گرفته شوند، ارتباط تنگاتنگی با پایگاه دادهها دارند.
انواع پایگاه دادهها عبارتند از:
تعریف پایگاه داده
سیستم بانک اطلاعاتی یک سیستم ک مپیوتری نگهداری رکوردهاست در وا قع آن را می توان بعنوان یک قضیه الکترونیکی برای نگهداری دادها رکوردها در نظرگرفت.
تعریف دیگری از پایگاه داده:مجموعهای از دادهای پایدار که توسط سیستم های کاربردی موجود در موسسات مورد استفاده قرار می گیرد.
انواع پایگاه داده
1-پایگاه داده پیمایشی
2-پایگاه داده رابطه ای
3-پایگاه داده چند بعدی(سلسله مراتبی)
4-پایگاه داده شی گرائی
5- پایگاه داده شبکه های
پایگاه دادههای پیمایشی
رشد کاربری کامپیوتر، پیدایش سیستمهای پایگاه دادههای همه منظوره را موجب گردید.
و در اواسط 1960 چنین سیستمهایی در بخش تجاری به کار گرفته شد.
چارلز بچ من، نویسنده یکی از چنین محصولاتی با نام IDS، گروه Database Task Group را بنیان نهاد که این گروه مسوول ایجاد و استاندارد سازی COBOL شد.
آنها در سال 1971 استاندارد خود را عرضه نمودند.
این استاندارد Codasyle approach نام داشت.
این شیوه مبتنی بر پیمایش دستی مجموعه دادهها بود.
هنگامی که پایگاه دادهها برای اولین بار برنامه را باز میکرد، به اولین رکورد در پایگاه دادهها و به همین ترتیب نیز به سایر بخشهای داده نیز اشاره میشد.
برنامه نویس برای دسترسی به یک رکورد خاص مجبور بود تا این اشارهگرها رابه ترتیب دنبال کند تا به رکورد موردنظر برسد.
در query های ساده مانند یافتن تمام افرادی که در سوئد زندگی میکنند باید برای جستجو در کل مجموعه دادهها برنامه نویسی میشد و دستوری به نام find وجود نداشت.
شرکت IBM سیستم مدیریت پایگاه دادههایی به نام IMS داشت.
این سیستم از نظر مفهوم مشابه codasyle بود، اما برخلاف آن که از مدل شبکهای استفاده مینمود، IMS مدل سلسله مراتبی را به کار میبرد.
پایگاه دادههای رابطهای
ادگار کاد که در شرکت آیبیام کار میکرد در سال 1970 مقالاتی در زمینه شیوه جدیدی برای ساخت پایگاه دادهها نوشت.
یکی از مقالات وی که Relational Model of Data for Shared Data Bank نام داشت، به بررسی سیستم جدیدی برای ذخیره سازی و کار با پایگاه دادههای بزرگ پرداخته بود.
در این شیوه به جای اینکه رکورد به صورت رکوردهای free-form همانگونه که در روش codasyle آمده بود، ذخیره شوند، از جدولی با رکوردهایی با طول ثابت استفاده میشد.
چنین سیستمی برای ذخیره سازی پایگاه دادههای پراکنده و در جاییکه بعضی از دادههای رکورد خالی هستند، کارآیی ندارد.
مدل رابطهای این مشکل را حل کرده است.
بدین صورت که دادهها به یکسری جدول تقسیم میشوند و عناصر اختیاری از جدول اصلی خارج میگردند و در صورت نیاز در جدول قرار میگیرند.
چنین سیستمی برای ردیابی اطلاعات کاربران، اسامی و نشانی آنان و غیره به کار میرود.
دادهها در روش پیمایشی در یک رکورد جای میگیرند و آیتمهایی که مورد استفاده قرار نگیرند، در پایگاه دادهها نیز نخواهند بود.
دادهها در شیوه رابطهای در جداول جداگانهای، مثلا جدول اسامی، جدول نشانیها و غیره جای میگیرند.
برقراری ارتباط بین اطلاعات نکته مهم در این سیستم است.
درمدل رابطهای بعضی از بیتهای اطلاعات به عنوان کلید معرفی میشوند و منحصرا بیانگر رکورد خاصی هستند.
هنگامی که اطلاعات کاربر جمع آوری میشود، میتوان این اطلاعات را که در جداول اختیاری ذخیره میشوند، با جستجوی کلید مربوطه یافت.
پایگاه دادههای چند بعدی
پایگاه دادههای رابطهای توانست به سرعت بازار را تسخیر کند، هرچند کارهایی نیز وجود داشت که این پایگاه دادهها نمیتوانست به خوبی انجام دهد.
به ویژه به کارگیری کلیدها در چند رکورد مرتبط به هم و در چند پایگاه داده مشترک، کندی سیستم را موجب میشد.
برای نمونه برای یافتن نشانی کاربری با نام دیوید، سیستم رابطهای باید نام وی را در جدول کاربر جستجو کند و کلید اصلی (primary key ) را بیابد و سپس در جدول نشانیها، دنبال آن کلید بگردد.
اگر چه این وضعیت
از نظر کاربر، فقط یک عملیات محسوب، اما به جستجو درجداول نیازمند است که این کار پیچیده و زمان بر خواهد بود.
راه کار این مشکل این است که پایگاه دادهها اطلاعات صریح درباره ارتباط بین دادهها را ذخیره نماید.
میتوان به جای یافتن نشانی دیوید با جستجو ی کلید در جدول نشانی، اشارهگر به دادهها را ذخیره نمود.
در واقع، اگر رکورد اصلی، مالک داده باشد، در همان مکان فیزیکی ذخیره خواهد شد و از سوی دیگر سرعت دسترسی افزایش خواهد یافت.
از نظر کاربر، فقط یک عملیات محسوب، اما به جستجو درجداول نیازمند است که این کار پیچیده و زمان بر خواهد بود.
در واقع، اگر رکورد اصلی، مالک داده باشد، در همان مکان فیزیکی ذخیره خواهد شد و از سوی دیگر سرعت دسترسی افزایش خواهد یافت.
چنین سیستمی را پایگاه دادههای چند بعدی مینامند.
این سیستم در هنگامی که از مجموعه دادههای بزرگ استفاده میشود، بسیار سودمند خواهد بود.
از آنجاییکه این سیستم برای مجموعه دادههای بزرگ به کار میرود، هیچگاه در بازار به طور مستقیم عمومیت نخواهد یافت.
پایگاه دادههای شیء اگر چه سیستمهای چند بعدی نتوانستند بازار را تسخیر نمایند، اما به توسعه سیستمهای شیء منجر شدند.
این سیستمها که مبتنی بر ساختار و مفاهیم سیستمهای چند بعدی هستند، به کاربر امکان میدهند تا اشیاء را به طور مستقیم در پایگاه دادهها ذخیره نماید.
بدین ترتیب ساختار برنامه نویسی شیء گرا (object oriented ) را میتوان به طور مستقیم و بدون تبدیل نمودن به سایر فرمتها، در پایگاه دادهها مورد استفاده قرار داد.
این وضعیت به دلیل مفاهیم مالکیت (ownership) در سیستم چند بعدی، رخ میدهد.
در برنامه شیء گرا (OO)، یک شیء خاص "مالک " سایر اشیاء در حافظه است، مثلا دیوید مالک نشانی خود میباشد.
در صورتی که مفهوم مالکیت در پایگاه دادههای رابطهای وجود ندارد.
ویژگیهای سیستم مدیریت پایگاه دادهها پس از این مقدمه به توصیف سیستم مدیریت پایگاه دادهها میپردازیم.
سیستم مدیریت پایگاه دادهها، مجموعهای پیچیده از برنامههای نرمافزاری است که ذخیره سازی و بازیابی دادههای (فیلدها، رکوردها و فایلها) سازمان را در پایگاه دادهها، کنترل میکند.
این سیستم، کنترل امنیت و صحت پایگاه دادهها را نیز بر عهده دارد.
سیستم مدیریت پایگاه دادهها، درخواستهای داده را از برنامه میپذیرد و به سیستم عامل دستور میدهد تا دادهها ی مناسب را انتقال دهد.
هنگامی که چنین سیستمی مورد استفاده قرار میگیرد، اگر نیازمندیهای اطلاعاتی سازمانی تغییر یابد، سیستمهای اطلاعاتی نیز آسانتر تغییر خواهند یافت.
سیستم مذکور از صحت پایگاه دادهها پشتیبانی میکند.
بدین ترتیب که اجازه نمیدهد بیش از یک کاربر در هر لحظه، یک رکورد را به روز رسانی کند.
این سیستم رکوردهای تکراری را در خارج پایگاه دادهها نگاه میدارد.
برای مثال، هیچ دو مشترک با یک شماره مشتری، نمیتوانند در پایگاه دادهها وارد شوند.
این سیستم روشی برای ورود و به روز رسانی تعاملی پایگاه دادهها فراهم میآورد.
یک سیستم اطلاعات کسب و کار از موضوعاتی نظیر (مشتریان، کارمندان، فروشندگان و غیره) و فعالیتهایی چون (سفارشات، پرداختها، خریدها و غیره) تشکیل شده است.
طراحی پایگاه دادهها، فرایند تصمیم گیری درباره نحوه سازماندهی این دادهها در انواع رکوردها و برقراری ارتباط بین رکوردهاست.سیستم مدیریت پایگاه دادهها میتواند ساختار دادهها و ارتباط آنها را در سازمان به طور اثر بخش نشان دهد.
سه نوع مدل متداول سازمانی عبارتند از: سلسله مراتبی، شبکهای و رابطهای.
یک سیستم مدیریت پایگاه دادهها ممکن است یک، دو یا هر سه روش را فراهم آورد.
سرورهای پایگاه دادهها، کامپیوترهایی هستند که پایگاه دادههای واقعی را نگاه میدارند و فقط سیستم مدیریت پایگاه دادهها و نرمافزار مربوطه را اجرا میکنند.
معمولا این سرورها کامپیوترهای چند پردازندهای با آرایههای دیسک RAID برای ذخیره سازی میباشند.
فهرست سیستمهای متداول مدیریت پایگاه دادهها Closed source : IBM (DB2) FileMaker, Inc (FileMaker Pro) IBM (IMS) Informix Computer Associates (Ingres) Borland (InterBase) Micosoft (Microsoft SQL Server) Microsoft (Microsoft Access) Mimer AB (Mimer SQL) Oracle Sybase NCR Corporation (Teradata) Open Source : Sleepycat software (Berkeley DB ) IBPhoenix (Firebird) My SQL AB (My SQL) PostgreSQL MaxDB SQLite - Data warehousing انبار دادهها تکنولوژی انبار دادهها شامل مجموعهای مفاهیم و ابزارهای جدیدی است که با فراهم آوردن اطلاعات از دانشگران (افراد اجرایی، مدیر و تحلیلگر) در تصمیم گیری پشتیبانی مینماید.
دلیل اصلی ساخت انبار داده ها، بهبود کیفیت اطلاعات در سازمان است، در واقع دسترسی به دادهها از هر جا درون سازمان دادهها از منابع داخلی و خارجی تهیه میشوند و به اشکال گوناگون از دادههای ساختاری گرفته تا دادههای ساخت نیافته مانند فایلهای متنی یا چند رسانهای، در مخزنی مجتمع میشوند.
انبار دادهها یا DWH مخزنی از این دادههاست که به صورتی قابل درک در دسترس کاربران نهایی کسب و کار قرار میگیرد.
از اواسط سالهای 1980 نیاز به انبار دادهها به وجود آمد و دریافتند که سیستم های اطلاعاتی باید به صورت سیستمهای عملیاتی و اطلاعاتی مشخص شوند.
سیستمهای عملیاتی از فعالیتهای روزانه کسب و کار پشتیبانی مینمایند و برای پاسخگویی سریع به ارتباطات از پیش تعریف شده مناسب هستند.
دادههای عملیاتی ارائه بیدرنگ و فعلی وضعیت کسب و کار میباشند.
اما سیستمهای اطلاعاتی برای مدیریت و کنترل کسب وکار به کار میروند.
این سیستمها از تجزیه و تحلیل دادهها برای اتخاذ تصمیم درباره عملکرد آنی و آتی سازمان پشتیبانی میکنند و برای در خواستهای موردی، پیچیده و به طور عمده فقط خواندنی طراحی شدهاند.دادههای اطلاعاتی تاریخی هستند، به عبارتی بیانگر دیدگاه ثابتی از کسب وکار در یک دوره زمانی میباشند.
ویژگیهای اصلی دادههای انبار دادهها دادههای موجود در انبار دادهها از سیستمهای عملیاتی متنوع (نظیر سیستمهای پایگاه دادهها) و منابع دادهای خارجی (نظیر پایگاه دادههای آماری و WWW )یکپارچه میشوند.
تفاوتهای ساختاری ومعنایی دادهها باید پیش از یکپارچه سازی انسجام یابند.
برای مثال دادهها باید مطابق با مدل دادهای یکپارچه "همگن" شوند.
بعلاوه، مقادیر دادهای سیستمهای عملیاتی باید پاک شوند تا دادههای صحیحی در انبار دادهها وارد شوند.
نیاز به دادههای تاریخی یکی از موارد مهم درشیوه انبار دادههاست.
دادههای تاریخی برای تحلیل روند کسب وکارضروری هستند.
البته هزینه نگهداری این گونه دادهها نیز باید مورد توجه قرار گیرد.
بعلاوه، دادههای انبار دادهها ثابت هستند، برای مثال دسترسی به DWH از نوع خواندنی است.
انجام اصلاحات در این دادهها فقط هنگامی صورت میگیرد که اصلاحات دادههای منبع در انبار انتشار یابند.
DWH دادههای دیگری به نام دادههای اشتقاق یافته (derived data) دارد.
این دادهها به طور صریح در منابع عملیاتی ذخیره نمیشوند، بلکه در حین بعضی از فرایندها از دادههای عملیاتی، اشتقاق مییابند.
برای مثال دادههای فروش را میتوان در سطوح مختلف (هفتگی، ماهانه، فصلی) در انبار ذخیره نمود.
سیستمهای انبار دادهها سیستم انبار دادهها (DWS) شامل انبار دادهها و همه مولفههایی است که برای ساخت، دستیابی و نگهداری DWH به کار میروند.
انبار دادهها بخش مرکزی سیستم انبار دادهها را تشکیل میدهد.
گاهی اوقات انبار دادهها حجم عظیمی از اطلاعات را در واحدهای منطقی کوچکتر به نام Data Mart نگهداری میکند.
مولفه آماده سازی، مسوولیت کسب یا دریافت دادهها را بر عهده دارد.
این مولفه شامل همه برنامهها وبرنامههای کاربردیای است که مسوول استخراج دادهها از منابع عملیاتی هستند.
مولفه دستیابی شامل برنامههای کاربردی مختلف (OLAP یا برنامههای کاربردی داده کاوی) است که امکان استفاده از اطلاعات ذخیره شده در انبار دادهها را فراهم میآورند.
مولفه مدیریت Metadata، وظیفه مدیریت، تعریف و دستیبابی به انواع مختلف Metadata را بر عهده دارد.
در اصل ،Metadata "دادههایی درباره دادهها" یا "دادههایی است که مفهوم دادهها را توصیف میکنند".
انواع مختلف Metadata در انبار دادهها وجود دارند.
مثلا اطلاعاتی درباره منابع عملیاتی، ساختار دادههای DWH و کارهایی که در حین ساخت، نگهداری و دستیبابی به DWH انجام میشوند.
نیاز به Metadata شناخته شده است.
پیاده سازی یک DWS منسجم ،کار پیچیده و دشواری است و شامل دو فاز می باشد.
درفاز اول که پیکربندی DWS نام دارد، دیدگاه مفهومی انبار دادهها مطابق با نیازمندیهای کاربر مشخص میشود.
سپس منابع دادهای دخیل و روش استخراج و بار گذاری در انبار دادهها تعیین میگردد.
سرانجام، درباره پایگاه دادههای مورد نظر و روشهای دستیبابی دادهها تصمیم گیری خواهد شد.
پس از بار گذاری اولیه، در فاز عملیات DWS باید دادههای انبار دادهها به منظور منظم refresh شوند.
طراحی انباردادهها روشهای طراحی انباردادهها امکان پردازش کارآمد query را برروی حجم عظیمی از دادهها فراهم میآورند.
نوع ویژهای از الگوی پایگاه دادهها به نام star برای مدل سازی انباردادههای چند بعدی به کار میرود.
در این حالت، پایگاه دادهها از یک جدول مرکزی واقعیت یا fact و جداول چند بعدی تشکیل شده است.
جدول واقعیت حاوی tuple هایی است که بیانگر واقعیتهای کسب و کار مانند فروش یا عرضه هستند.
هر tuple جدول واقعیت به tupleهای جدول چند بعدی اشاره دارد.
هرtuple جدول چند بعدی مواردی نظیر محصولات، مشتریان، زمان و فروشنده را نشان میدهد.
انباردادههای مجازی هدف انباردادههای مجازی، پیاده سازی سریع انباردادهها بدون نیاز به ذخیره سازی و نگهداری کپیهای متعدد از دادههای منبع است.
اغلب، انباردادههای مجازی به سازمانها کمک میکند تا به نیاز واقعی کاربران نهایی پی ببرند.
کاربران نهایی میخواهند به طور مستقیم به دادههای منبع بی درنگ با کمک ابزارهای توانمند شبکهای دسترسی پیدا کنند.
معایب این روش عبارتند از: - کیفیت و سازگاری دادهها تضمین نمیشود.
زیرا فعالیتهای آماده سازی دادهها صورت نمیگیرند.
- به طور معمول، دادههای تاریخی وجود ندارند.
- زمان دسترسی کاربر نهایی بسته به وجود یا عدم وجود منابع عملیاتی، بار شبکه و پیچیدگی درخواست، غیر قابل پیش بینی است.
داده کاوی داده کاوی فرایندی تحلیلی است که برای کاوش داده ها ( معمولا حجم عظیمی از داده ها - در زمینه های کسب وکار و بازار) صورت میگیرد و یافتههابابهکارگیری الگوهایی،احراز اعتبار میشوند .
هدف اصلی داده کاوی پیش بینی است.
فرایند داده کاوی شامل سه مرحله می باشد : 1.
کاوش اولیه 2.
ساخت مدل یا شناسایی الگو با کمک احراز اعتبار/ تایید و 3.
بهره برداری.
مرحله 1 : کاوش.
معمولااینمرحله با آماده سازی داده ها صورت می گیرد که ممکن است شامل پاک سازی داده ها ،تبدیل داده هاوانتخاب زیرمجموعههایی از رکوردهاباحجمعظیمیازمتغییرها( فیلدها ) باشد .
سپس با توجهبهماهیتمساله تحلیلی، اینمرحلهبهمدلهای پیش بینی ساده یا مدلهایآماریوگرافیکی برای شناسایی متغیرهای مورد نظر و تعیین پیچیدگی مدلها برای استفاده در مرحله بعدی نیاز دارد .
مرحله 2:ساخت و احراز اعتبار مدل.
اینمرحلهبه بررسیمدلهای مختلف و گزینش بهترین مدل با توجه به کارآیی پیشبینی آن می پردازد.
شاید این مرحله ساده به نظر برسد، اما اینطورنیست.
تکنیکهایمتعددیبرایرسیدنبهاینهدف توسعه یافتند.و " ارزیابی رقابتی مدل ها"نام گرفتند.
بدین منظور مدلهای مختلف برای مجموعه دادههای یکسانبهکارمیروندتاکارآییشانباهم مقایسهشود ،سپس مدلی کهبهترین کارآیی راداشته باشد، انتخاب میشود.اینتکنیکها عبارتند از : Bagging,Boosting ,Stacking و Meta-learning.
مرحله 3 : بهره برداری.
آخرینمرحلهمدلیراکهدرمرحله قبلانتخابشده است، در دادههایجدیدبه کارمیگیردتا پیشبینیهایخروجیهای مورد انتظاررا تولید نماید.داده کاویبهعنوانابزارمدیریتاطلاعاتبرایتصمیم گیری،عمومیتیافتهاست.
اخیرا،توسعه تکنیک های تحلیلی جدید در این زمینه مورد توجه قرار گرفته است (مثلا Classification Trees)،اما هنوز داده کاوی مبتنی بر اصول آماری نظیر(Exploratory Data Analysis (EDA)می باشد.
بااین وجود تفاوت عمده ای بین داده کاوی و EDA وجوددارد.دادهکاویبیشتربهبرنامههایکاربردی گرایش دارد تا ماهیت اصلی پدیده .به عبارتیداده کاوی کمتر با شناسایی روابط بین متغیرها سروکار دارد .
مفاهیم اساسی در داده کاوی Bagging: این مفهوم برای ترکیب رده بندی های پیش بینی شده از چند مدل به کار می رود.فرض کنیدکه قصدداریدمدلی برای رده بندی پیش بینی بسازیدو مجموعه داده های مورد نظرتان کوچک است.شمامی توانید نمونه هایی( با جایگزینی) را از مجموعه داده ها انتخاب و برای نمونه های حاصل ازدرخت رده بندی (مثلا C&RT وCHAID )استفاده نمایید.به طورکلی برای نمونه های مختلف به درخت های متفاوتی خواهید رسید.سپس برای پیش بینی با کمک درخت های متفاوت به دست آمده از نمونه ها ،یک رای گیری ساده انجام دهید.رده بندی نهایی ، رده بندی ایخواهد بود که درخت های مختلف آنرا پیش بینی کرده اند .
Boosting: این مفهوم برای تولید مدلهای چندگانه (برای پیش بینی یا رده بندی)به کار میرود.
Boosting نیزاز روش C&RT یا CHAID استفاده وترتیبی از classifier ها را تولید خواهد کرد .
Meta-Learning : این مفهوم برای ترکیب پیش بینیهای حاصل از چند مدل به کار میرود.و هنگامی که انواع مدلهای موجود در پروژه خیلی متفاوت هستند، کاربرد دارد.
فرض کنید که پروژه داده کاوی شما شامل Tree classifierها نظیر C&RTو CHAID، تحلیل خطی و شبکه های عصبی است.هر یک از کامپیوترها،رده بندی هایی رابرای نمونه هاپیش بینی کرده اند.تجربه نشان میدهدکه ترکیب پیش بینی های چند روش دقیق تراز پیش بینی های هریک از روشهاست.پیش بینی های حاصل از چند classifier را می توان به عنوان ورودی meta-linear مورد استفاده قرار داد.
meta-linear پیش بینی هارا ترکیب می کند تا بهترین رده بندی پیش بینی شده حاصل شود.
Document warehousing - مدیریت ارتباط با مشتری (CRM) شامل : - سیستم مدیریت فروش برنامه ریزی منابع سازمانی ERP)) مدیریت کارآیی کسب وکار(BMP) نرم افزار مدیریت پروژه مدیریت یکپارچه سازی: - میان افزار Middleware سیستم های گروه افزار و مشارکتی: - RSA طراحی به کمک کامپیوتر (CAD) ساخت به کمک کامپیوتر( CAM) مدیریت دانش( KMS) سیستم پشتیبان تصمیم گیری (DSS) پردازش الکترونیک داده ها(EDP) سیستم اطلاعات جغرافیا (GIS) برنامه ریزی مواد (MRP) مدیریت استراتژیک سازمان مدیریت زنجیره تامین SCM) ) مدیریت مجازی ■ تچارت الکترونیک E-commerce تجارت الکترونیک کسب و کار – کسب وکار B2B) ) - مبادلات کسب وکار – کسب وکار کسب وکار – کارمند (B2E) کسب و کار – دولت (B2G) تجارت الکترونیک کسب وکار – مشتری (B2C) مدل کسب وکار حراجی آن لاین C2C)) سیستم های نقطه به نقطه P2P)) خدمات الکترونیک پول الکترونیک تجارت وب شکوفایی dot com امنیت کامپیوتر: - امنیت لایه انتقال SSL)) - گواهینامه الکترونیک - رمز گذاری مبتنی بر گواهینامه مدیریت محتوای وب - سیستم مدیریت محتوا ■ بازاریابی الکترونیک بازاریابی شخصی سیستم های CRM سیستم مدیریت فروش banner وب تبلیغات وب سایت چند رسانه ای حفظ اطلاعات مشتری اسپم (E-learning) آموزش الکترونیک■ (E-Government) دولت الکترونیک■ ( BI ) هوشمندی تجاری ■ سیستم مدیریت پایگاه دادهها سیستم مدیریت پایگاه دادهها (DBMS )، یک یا مجموعهای از چند برنامه کامپیوتری است که برای مدیریت پایگاه دادهها، مجموعه عظیمی از دادههای ساخت یافته و عملیات اجرایی بر روی دادههای درخواستی کاربران، طراحی شده است.
سیستمهای حسابداری، منابع انسانی و پشتیبان مشترک، نمونههایی از کاربرد سیستم مدیریت پایگاه دادهها هستند.
این سیستمها که پیشتر فقط در شرکتهای بزرگ مطرح بودند، اخیرا بخش مهمی در شرکت محسوب میشوند.
تفاوت سیستمهای مدیریت پایگاه دادهها با برنامههای پایگاه دادهها در این است که سیستمهای مذکور به عنوان موتور سیستم چندکاربره طراحی شدهاند.
این سیستمها برای ایفای چنین نقشی، در کرنل مالتی تسکینگ خصوصی با پشتیبان شبکهای از پیش ساخته شده، قرار گرفتهاند.
یک برنامه پایگاه داده نمونه، این گونهها را در درون خود ندارد، اما شاید بتواند با کمک سیستم عامل از عملکرد چنین گونههایی پشتیبانی کند.