داده کاوی و مدلسازی عامل بنیان

تعریف داده کاوی:

در یک تعریف ساده، می توان داده کاوی را به این شکل تعریف کرد:

داده‌ کاوی (Data Mining) علم استخراج الگوها، اطلاعات و تحلیل از مجموعه داده‌های خامی است که در یک سازمان و یا یک جامعه یا هر مجموعه دیگری تولید شده است.

همچنین در ویکی پدیا داده کاوی به این شکل تعریف شده است:

داده‌ کاوی (به انگلیسی: Data Mining)، به مفهوم استخراج اطلاعات نهان یا الگوها و روابط مشخص در حجم زیادی از داده‌ها در یک یا چند بانک اطلاعاتی بزرگ گفته می‌شود. بسیاری از مردم داده کاوی را مترادف واژه‌های رایج کشف دانش در پایگاه‌داده‌ها (به انگلیسی: knowledge discovery in databases) (اختصاری KDD) می‌دانند. داده‌کاوی، پایگاه‌ها و مجموعه حجیم داده‌ها را در پی کشف و استخراج، مورد تحلیل قرار می‌دهد. این‌گونه مطالعات و کاوش‌ها را به واقع می‌توان همان امتداد و استمرار دانش کهن و همه جا گیر آمار دانست. تفاوت عمده در مقیاس، وسعت و گوناگونی زمینه‌ها و کاربردها، و نیز ابعاد و اندازه‌های داده‌های امروزین است که شیوه‌های ماشینی مربوط به یادگیری، مدل‌سازی، و آموزش را طلب می‌نماید.

مدلسازی عامل بنیان:

تعریف مدلسازی را می توانید در این صفحه بخوانید. همچنین در ویکی پدیا تعریف بدین صورت می باشد:

مدل‌سازی عامل‌بنیان (به انگلیسی: Agent-based model) (که با عنوان‌های دیگری مانند مبتنی بر عامل، چندعاملی و عامل محور نیز شناخته می‌شود) که گاهی با عنوان شبیه‌سازی عامل بنیان (Agent-Based Simulation) نیز شناخته می‌شود، نوعی از مدل‌سازی محاسباتی (Computational modeling) است که امکان مدل‌سازی یک سیستم را از پایین به بالا (Bottom-up) میسر می‌سازد. جهت مدل به این حقیقت اشاره دارد که مدل‌ساز ابتدا اجزای (عامل‌های) یک سیستم را شناسایی می‌کند، سپس رفتار آنها و نحوه تعاملات آنها را تعریف نموده و در آخر و با راه‌اندازی مدل مشاهده می‌کند که رفتار و تعاملات (اجزا در کنار) چه اتفاقاتی را در سطح کلان سیستم به وجود می‌آورند. در واقع، مدل‌سازی عامل بنیان (ABM) نشان می‌دهد که چگونه قواعد رفتاری و گاه ساده عامل‌ها و تعاملات محلی میان آنها در سطح خرد می‌تواند الگوهای بسیار پیچیدهای را در سطح کلان ایجاد کند.

 

مدلسازی عامل بنیان درون علوم داده است؟

اما آنچه در این مقاله اهمیت دارد، قرار گیری نوع مدلسازی عامل بنیان در علوم محاسباتی و علوم داده است. در یک دیدگاه، علوم داده به دو بخش هوش تجاری (Business intelligence) و تحلیل های پیشرفته (Advanced Analytics) تقسیم بندی می شود.

بخش هوش تجاری به تحلیل داده ها از پایگاه داده ها مرتبط می شود که در این مقاله به آن نمی پردازیم.

بخش تحلیل های پیشرفته خود به چند بخش تقسیم می شوند:

  • داده کاوی (Data mining)
  • تحلیل پیش بینانه (Predictive analytics)
  • شبیه سازی (Simulation)
  • بهینه سازی (Optimization)

داده کاوی خود به شاخته های مختلفی تقسیم شده است و هر کدام توسط روش های خاصی، نسبت به تحلیل و کاوش در داده ها می پردازند.

اما مدلسازی عامل بنیان که به اسم شبیه سازی عامل بنیان نیز شناخته می شود، یک ساختار متفاوت دارد. با استفاده از این روش، آمار، ریاضیات، محاسبات مختلف کامپیوتری و حتی هوش مصنوعی نیز درگیر موضوع می شوند.

شکل بالا، یک ساختار با جزئیات را از تقسیم بندی علوم داده به ما نشان می دهد.

keyboard_arrow_up