آمار وان حمام – پویایی سیستم
مشکلات تطبیق الگو فقط برای مقایسههای شهودی رفتار سهام و جریانهای مرتبط اعمال نمیشود. آنها همچنین در مورد آمار اعمال می شوند. این بدان معنی است که برای مثال، یک رگرسیون خطی مانند
stock = a + b*flow + c*time + error
به احتمال زیاد به اشتباه جدی می رود. با این حال، این مانع از ورود چنین چیزهایی به ادبیات بررسی شده نمی شود. یک خطای شبه آماری رایجتر این است که دو چیز را که ممکن است مرتبط باشند، اندازهگیری کنید، روند خطی آنها را اندازهگیری کنید و اگر روندها مطابقت نداشتند، رابطه را جعلی اعلام کنید. این استدلال ساختگی همچنان یکی از سرگرمیهای رایج برای شکاکان آب و هوا است، که میپرسند چگونه دما در دورهای که انتشار گازهای گلخانهای افزایش مییابد پایین میآید؟ (این مثال را ببینید.) این نوع استدلال آماری ساده لوحانه، با مدل های ذهنی ایستا از پدیده های پویا، به سختی به شکاکان آب و هوا محدود می شود.
با توجه به پویایی، در واقع بسیار آسان است که ببینیم چگونه چنین چیزهایی می توانند رخ دهند. در اینجا یک مثال کاملتر از یک موقعیت واقعی آورده شده است:
در هسته، جریان یکسانی را داریم که انباشت را هدایت می کند. جریان توسط انواع ورودی های آزمایشی تعیین می شود، بنابراین ما هنوز نگران علیت دایره ای بین سهام و جریان نیستیم. به طور بالقوه بازخوردی از انباشت برای خروج وجود دارد، اگرچه این به طور پیش فرض فعال نیست. انباشت همچنین تحت تأثیرات تصادفی دیگری قرار دارد، با انحراف استاندارد که توسط Driving Noise SD ارائه شده است. ما لزوماً نمی توانیم انباشت و جریان را مستقیماً مشاهده کنیم. مشاهدات ما در معرض خطای اندازه گیری هستند. برای اهدافی که بهطور لحظهای آشکار میشوند، ممکن است برخی دستکاریهای ساده در اندازهگیریهای خود مانند تاخیر و تفاوت انجام دهیم. ما همچنین می توانیم روند انباشت و جریان را اندازه گیری کنیم. توجه داشته باشید که این هنوز هم کمی واقعیت را ساده میکند، زیرا اندازهگیری جریان بهجای نیاز به فرآیند ادغام خود آنگونه که فیزیک میخواهد، آنی است. هیچ عارضه ای مانند داده های از دست رفته یا فواصل اندازه گیری نابرابر وجود ندارد.
حالا برای یک آزمایش ابتدا فرض کنید که جریان تصادفی است (نویز صورتی) و هیچ خطای اندازه گیری، صدای رانندگی یا خروجی وجود ندارد. در آن صورت، این را می بینید:
وان در واقع میتواند با تقسیم کردن آنها به قسمتهای ظاهری، نتایج خرافی در مورد سریهای زمانی انباشت و جریان در بالا بگیرد، اما این احتمالاً گمراهکننده است، مگر اینکه به صراحت به وان حمام فکر کنید. با نگاهی به نمودار پراکندگی جریان-انباشت، به نظر می رسد که هیچ رابطه ای وجود ندارد:
البته، ما می دانیم که این اشتباه است، زیرا ما مدل را با علیت Flow->Stock کامل ساختیم. ترفند آماری معمول برای آشکار کردن رابطه، خنثی کردن ادغام با گرفتن اولین تفاوت دادههای موجودی است. وقتی این کار را انجام میدهید، نمودار تغییر انباشت در مقابل جریان (یک دوره تاخیر برای محاسبه تفاوت)، رابطه دوباره ظاهر میشود:
متأسفانه، این یک روش بسیار قوی نیست. مشتقات نویز را تقویت میکنند، و اشتباه کردن چیزهای دیگر آسان است، مانند ناهماهنگی تاخیرهای گزارش. با اضافه کردن نویز رانندگی و خطاهای اندازه گیری به آخرین آزمایش، می توانیم ببینیم که چگونه شیب مشاهده شده رابطه در مه ناپدید می شود:
قرعهکشیهای تصادفی خوش شانس در مقابل بدشانس، با روابطی که تا حدی تا کاملاً توسط نویز پنهان شده است.
در هر صورت، مقایسه روند جریان و انباشت آموزنده نیست. در واقع، مقایسه روند مشتقات هر دو طرف معادله را می گیرد، بنابراین ادغام را خنثی نمی کند – فقط آن را به سطح دیگری منتقل می کند و نویز را تقویت می کند. در اینجا مقایسه ای از تخمین روند (از مرتبه دوم صاف) از آزمایش پر سر و صدا بالا آمده است:
در واقع مهم نیست که از چه الگوریتم هموارسازی یا رگرسیونی برای تخمین روندها استفاده می کنید، زیرا هیچ مقداری از دستکاری نمی تواند این واقعیت را جبران کند که دینامیک وان حمام را نادیده می گیرید.
در مواردی که نویز تفاوت را از بین میبرد، هنوز هم میتوان با پیچیدهتر شدن (تخمین یک مدل پویا، با فیلتر کالمن)، اطلاعاتی را از آزمایشهای بالا بهدست آورد، اما برای این کار باید کاملاً در وان حمام غوطهور شوید.
به روز رسانی: مدل در کتابخانه من است.