این پست باید برای همه مدلسازان مطالعه اجباری باشد. و نه، من قصد ندارم شیوههای مدلسازی سهلانگارانه را سرزنش کنم. این موضوع بسیار جالبتر از آن است.
مدلهای سهلانگارانه، ایدهای هستند که بیانیهای را که جی فارستر مدتها پیش در پویایی صنعتی (13.5) بیان کرد، رسمی میکند:
سومین و کماهمیتترین جنبه یک مدل که در قضاوت در مورد اعتبار آن باید در نظر گرفته شود، مقادیر پارامترهای آن (ضرایب ثابت) است. پویایی سیستم نسبت به بسیاری از آنها نسبتاً غیرحساس خواهد بود. آنها را میتوان در هر جایی در یک محدوده قابل قبول انتخاب کرد. چند پارامتر حساس توسط آزمایشهای مدل شناسایی میشوند، و دانستن مقادیر گذشته آنها به اندازه کنترل مقادیر آینده آنها در طراحی مجدد سیستم اهمیت ندارد.
این موضوع زمانی که شما به تخمین پارامترها از دادهها علاقه دارید، همچنان صادق است. در Ventana، ما به این واقعیت تکیه میکنیم که ساختار و پارامترهایی که اندازهگیری برای آنها ندارید، معمولاً خود را در پویایی نشان میدهند، اگر از نظر پویا مهم باشند. (همیشه موارد آسیبشناختی وجود دارد، جایی که یک غیرخطی بودن چیزی را در گذشته بیربط و در آینده مهم میکند، اما به همین دلیل است که ما مدلها را صرفاً بر اساس دادههای رسمی قرار نمیدهیم.)
اکنون، قسمت الزامی.
جیمز ستنا و همکارانش در کرنل، مشاهده فارستر را رسمی کردهاند و پدیده عدم حساسیت را “سهلانگاری (sloppiness)” مینامند. آنچه در ادامه میآید خلاصه کوتاهی است، اما من شما را تشویق میکنم که پیوندها را به مطالب اصلی دنبال کنید.
مدتهاست که مشخص شده است که بسیاری از مدلهای چندپارامتری به طور شل محدود شده یا بد شرط هستند: مجموعههای پارامترهای زیادی میتوانند رفتار مشابهی را نشان دهند. با این حال، هنگامی که ما در حال بررسی برخی از مشکلات در زیستشناسی سیستمها بودیم، از دامنههای غولپیکر پارامترهایی که هنوز میتوانند با دادهها مطابقت داشته باشند، شگفتزده شدیم. هر یک از پارامترهای مدل ما میتوانست حداقل با ضریب پنجاه و بسیاری با ضرایب هزاران (چپ) بدون تغییر رفتار تغییر کند. و با این حال، مدل مفید بود – این مجموعههای پارامترهای بسیار متفاوت برای بسیاری از پیشبینیهای مهم توافق داشتند.
نامیدن مدلی مانند این “شل محدود شده” مانند نامیدن اقیانوس خیس است. ما این مدلها را مدلهای سهلانگارانه مینامیم. با این حال، تأکید میکنیم که باید سهلانگاری را نه به عنوان یک شکست مدل، بلکه به عنوان یک ویژگی آن در نظر گرفت! برخی از دقیقترین محاسبات در فیزیک (توابع موج تغییرپذیر مورد استفاده در کوانتوم مونت کارلو برای محاسبات انرژی مولکولی با دقت بالا) سهلانگارانه هستند. خواهیم دید که سهلانگاری اغلب با قدرت پیشبینی خوب، برای تقریباً همه چیز مورد علاقه به جز پارامترها، سازگار است.
مدلهای سهلانگارانه چه هستند؟ ما ادعا میکنیم که بسیاری اگر نگوییم اکثر مدلهای دارای چندین پارامتر برازش (مثلاً بیش از پنج) سهلانگارانه هستند. مدلهای سهلانگارانه “به طور ضعیف محدود شده” و “بد شرط” نامیده میشوند زیرا استفاده از دادههای تجربی برای فهمیدن پارامترهای آنها دشوار است. …
آیا سهلانگاری مختص سیستمهای بیولوژیکی است؟ ظاهراً نه! ما سهلانگاری را در مدلهای چندپارامتری که حوزههای زیادی را در بر میگیرند، از مدلهای پرواز حشرات گرفته تا پتانسیلهای بین اتمی، تا طراحی شتابدهنده پیدا کردهایم – هر مدل چندپارامتری که تاکنون مطالعه کردهایم، سهلانگارانه به نظر میرسد.
این موضوع با تجربه شخصی من با انواع مختلف مدلها، از جمله آب و هوا، زنجیرههای تأمین، ترافیک، پروژهها و بازاریابی دارویی، همخوانی دارد.
همانطور که با چند مثال نشان میدهند، سهلانگاری از شکل تابع هزینه، یعنی تابع بازدهی که برازش دادهها را به عنوان تابعی از پارامترها اندازهگیری میکند، ناشی میشود.
در نزدیکی برازش بهینه، تقریباً همیشه خواهیم دید که سطوح کانتور هزینه بیضیوارها را تشکیل میدهند – در امتداد جهتهای سهلانگارانه طولانی کشیده شده و در امتداد جهتهای سفت فشرده شدهاند. این بیضیوارها را میتوان با مقادیر ویژه و بردارهای ویژه هسین توصیف کرد … هزینه در نزدیکی برازش بهینه. بردارهای ویژه در امتداد محورهای مختلف بیضی قرار میگیرند؛ ما این ترکیبات پارامتر را پارامترهای ویژه، برخلاف پارامترهای خام که در ابتدا برای نوشتن مدل خود انتخاب کردیم، مینامیم. …
برخی از جهات در فضای پارامتر سفت هستند و باعث تغییرات بزرگ در معیار برازش میشوند، در حالی که برخی دیگر سهلانگارانه هستند و باعث تغییرات کوچک میشوند. در امتداد جهات سهلانگارانه، نمیتوانید از دادهها برای اندازهگیری پارامترها استفاده کنید، زیرا ترکیبات مختلف رفتاری را ایجاد میکنند که عملاً غیرقابل تشخیص است. با این حال، عدم حساسیت رفتار به این ترکیبات پارامتر نیز به این معنی است که پیشبینیهای (سیاستی) نسبت به عدم قطعیت آنها مقاوم هستند.
بنابراین، فیزیک، زیستشناسی سیستمها و احتمالاً بقیه علم همگی به نوعی فشردهسازی اطلاعات در مورد قوانین سیستم تکیه میکنند. رفتار سیستم جمعی در هر مورد فقط به چند ترکیب “سفت” از پارامترها از متغیرهای زیاد در توصیف میکروسکوپی کامل تکیه میکند. در فیزیک، ما روشهای سیستماتیک برای استخراج این نظریههای نوظهور و جمعی از پیچیدگی میکروسکوپی داریم. در سایر زمینهها، ما چنین ابزارهایی نداریم – اما نظریهها همان نوع استقلال را از جزئیات میکروسکوپی نشان میدهند.
آب و هوا یک مثال از این موضوع ارائه میدهد. در مدل اشنایدر تامپسون (و سایر مدلهای تعادل انرژی)، سه پارامتر به شدت در هم تنیده شدهاند: حساسیت آب و هوا، انتقال حرارت اقیانوس و بزرگی نیروی آئروسل تاریخی. میتوانید با حساسیت بالا و انتقال حرارت سریع یا حساسیت پایین و انتقال حرارت آهسته، مسیرهای دمای جهانی مشابهی را به دست آورید. این یک جهت سهلانگارانه است. از طرف دیگر، میتوانید به سرعت ترکیبات را در جهت عمود سفت رد کنید، مانند حساسیت بالا با انتقال حرارت آهسته، زیرا دمای غیرقابل قبولی تولید میکنند. اگر به دما علاقه دارید و نه به خود مقادیر پارامتر، آنگاه سهلانگاری اهمیت چندانی ندارد. شما پاسخهای دمای گذرا آینده مشابهی را برای این قرن با هر ترکیبی از پارامترها که دمای تاریخی قابل قبولی تولید میکند، دریافت میکنید.
آئروسلها به همین ترتیب در هم تنیده شدهاند – آئروسلهای تاریخی بالا نشان میدهند که برخی از گرمایش سرکوب شده است و بنابراین ترکیب حساسیت-انتقال نیز باید بزرگتر باشد. اما این کمی پیچیدهتر است، زیرا ممکن است آئروسلها را مستقل از گازهای گلخانهای در آینده تغییر دهیم، بنابراین ما علاقه ذاتی به رفتار آنها داریم. اندازهگیری دما نمیتواند در این زمینه به ما کمک کند؛ ما به انواع دیگر مدلها و دادهها نیاز داریم تا به بعد آئروسل به طور مستقل بپردازیم. در صورت عدم موفقیت، باید عدم قطعیت در پیشبینیها را در نظر بگیریم.
البته میتوان آزمایشهای ویژهای را برای اندازهگیری یک پارامتر در یک زمان طراحی کرد (اجتناب از رفتار جمعی کل مدل). اگر همه پارامترها را اندازهگیری میکردیم … و مدل هنوز با دادهها مطابقت داشت، آنگاه میتوانستیم بسیار مطمئنتر باشیم که مدل واقعاً صحیح است – هیچ پیوند یا مسیر واکنش مهمی وجود ندارد که با دستکاری (یا بازسازی) پارامترهای مدل موجود برازش داده شده باشد.
…
آیا اندازهگیری پارامترها مفید است؟ به طور خاص، فرض کنید (همانطور که معمولاً اتفاق میافتد) اندازهگیری هر پارامتر آخر امکانپذیر نیست. آیا میتوان پیشبینیها را از مدلها استخراج کرد زمانی که فقط نیمی از پارامترها اندازهگیری شدهاند؟ در مورد همه پارامترها به جز یک پارامتر چطور؟ در واقع، برای مدلهای سهلانگارانه، ممکن است انتظار داشت که حتی یک پارامتر از دست رفته میتواند مشکلات شدیدی ایجاد کند.
…
نتیجهگیری ما؟ سیستمهای سهلانگارانه ارتباط عجیبی بین پارامترها و رفتار مدل دارند. نه تنها نمیتوانید از رفتار مدل برای تعیین پارامترها استفاده کنید، بلکه برعکس، دانش جزئی از پارامترها برای پیشبینی رفتار مدل بیفایده است. زیستشناسان درست میگویند: اندازهگیری پارامترها خستهکننده است، اگر سیستم شما سهلانگارانه باشد.