داده کاوی و مدلسازی عامل بنیان
تعریف داده کاوی:
در یک تعریف ساده، می توان داده کاوی را به این شکل تعریف کرد:
داده کاوی (Data Mining) علم استخراج الگوها، اطلاعات و تحلیل از مجموعه دادههای خامی است که در یک سازمان و یا یک جامعه یا هر مجموعه دیگری تولید شده است.
همچنین در ویکی پدیا داده کاوی به این شکل تعریف شده است:
داده کاوی (به انگلیسی: Data Mining)، به مفهوم استخراج اطلاعات نهان یا الگوها و روابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطلاعاتی بزرگ گفته میشود. بسیاری از مردم داده کاوی را مترادف واژههای رایج کشف دانش در پایگاهدادهها (به انگلیسی: knowledge discovery in databases) (اختصاری KDD) میدانند. دادهکاوی، پایگاهها و مجموعه حجیم دادهها را در پی کشف و استخراج، مورد تحلیل قرار میدهد. اینگونه مطالعات و کاوشها را به واقع میتوان همان امتداد و استمرار دانش کهن و همه جا گیر آمار دانست. تفاوت عمده در مقیاس، وسعت و گوناگونی زمینهها و کاربردها، و نیز ابعاد و اندازههای دادههای امروزین است که شیوههای ماشینی مربوط به یادگیری، مدلسازی، و آموزش را طلب مینماید.
مدلسازی عامل بنیان:
تعریف مدلسازی را می توانید در این صفحه بخوانید. همچنین در ویکی پدیا تعریف بدین صورت می باشد:
مدلسازی عاملبنیان (به انگلیسی: Agent-based model) (که با عنوانهای دیگری مانند مبتنی بر عامل، چندعاملی و عامل محور نیز شناخته میشود) که گاهی با عنوان شبیهسازی عامل بنیان (Agent-Based Simulation) نیز شناخته میشود، نوعی از مدلسازی محاسباتی (Computational modeling) است که امکان مدلسازی یک سیستم را از پایین به بالا (Bottom-up) میسر میسازد. جهت مدل به این حقیقت اشاره دارد که مدلساز ابتدا اجزای (عاملهای) یک سیستم را شناسایی میکند، سپس رفتار آنها و نحوه تعاملات آنها را تعریف نموده و در آخر و با راهاندازی مدل مشاهده میکند که رفتار و تعاملات (اجزا در کنار) چه اتفاقاتی را در سطح کلان سیستم به وجود میآورند. در واقع، مدلسازی عامل بنیان (ABM) نشان میدهد که چگونه قواعد رفتاری و گاه ساده عاملها و تعاملات محلی میان آنها در سطح خرد میتواند الگوهای بسیار پیچیدهای را در سطح کلان ایجاد کند.
مدلسازی عامل بنیان درون علوم داده است؟
اما آنچه در این مقاله اهمیت دارد، قرار گیری نوع مدلسازی عامل بنیان در علوم محاسباتی و علوم داده است. در یک دیدگاه، علوم داده به دو بخش هوش تجاری (Business intelligence) و تحلیل های پیشرفته (Advanced Analytics) تقسیم بندی می شود.
بخش هوش تجاری به تحلیل داده ها از پایگاه داده ها مرتبط می شود که در این مقاله به آن نمی پردازیم.
بخش تحلیل های پیشرفته خود به چند بخش تقسیم می شوند:
- داده کاوی (Data mining)
- تحلیل پیش بینانه (Predictive analytics)
- شبیه سازی (Simulation)
- بهینه سازی (Optimization)
داده کاوی خود به شاخته های مختلفی تقسیم شده است و هر کدام توسط روش های خاصی، نسبت به تحلیل و کاوش در داده ها می پردازند.
اما مدلسازی عامل بنیان که به اسم شبیه سازی عامل بنیان نیز شناخته می شود، یک ساختار متفاوت دارد. با استفاده از این روش، آمار، ریاضیات، محاسبات مختلف کامپیوتری و حتی هوش مصنوعی نیز درگیر موضوع می شوند.
شکل بالا، یک ساختار با جزئیات را از تقسیم بندی علوم داده به ما نشان می دهد.