تنقیب البیانات المتدفقة بین التطبیقات القدیمة والحدیثة: مقال مراجعة
الملخص
التنقیب عن البیانات هی تقنیة قویة مع امکانیة کبیرة لمساعدة الشرکات والمنظمات للترکیز على المعلومات الاکثر اهمیة فی البیانات التی جمعتها حول سلوک زبائنها والزبائن المحتملین. فهی تکتشف المعلومات التی داخل البیانات والتی لا تستطیع الاستعلامات والتقاریر التقلیدیة ان تبینها. بشکل عام، التنقیب عن البیانات هی عملیة تحلیل للبیانات من مختلف وجهات النظر وتلخیصها الى معلومات مفیدة – معلومات یمکن استخدامها لزیادة الایرادات او خفض التکالیف او کلاهما. تنقیب البیانات یسمح للمستخدمین بتحلیل البیانات من مختلف المدیات او الزوایا، وتصنیفها، وتلخیص العلاقات التعریفیة. هناک اربع تقنیات للتنقیب عن البیانات: 1) التصنیف والانحدار، 2) العنقدة، 3) التنقیب فی قوانین الارتباط، 4) الکشف عن الحالات الشاذة. موخرا، کان تشخیص مبدا السرعة للبیانات الضخمة له اهتمام کبیر لدى مجموعة الباحثین من خلال التاثیر المهم لهذا المبدا على البیانات غالبا من کل قسم من اقسام الحیاة؛ مثل الرعایة الصحیة، سوق الاسهم، شبکات التواصل الاجتماعی، الى اخرة. کثیر من البحوث قامت بتحقیق مبدا السرعة هذا من خلال التنقیب عن البیانات المتدفقة. اغلب بحوث التنقیب عن البیانات المتدفقة فی الوقت الحالی ترکز على تکییف الاصناف الرئیسة من الطرائق والخوارزمیات والتقنیات المستخدمة للبیانات الثابتة للتعامل مع البیانات المتغیرة. هذا البحث یراجع بشکل واسع الادبیات الحالیة الموجودة فی حقل التنقیب عن البیانات المتدفقة ویعرف وحدات العملیات الاساسیة الموجودة وراء مختلف الخوارزمیات الحالیة. بحث المراجعة هذا مفید لیس فقط للباحثین فی تطویر افکار بحثیة قویة وایجاد الثغرات فی هذا الحقل بل کذلک یساعد المساهمین فی حقل التنقیب عن البیانات المتدفقة وتطبیقات البیانات الضخمة.