Login Register

ورود به حساب کاربری

نام کاربری
رمز عبور *
مرا به خاطر بسپار

ایجاد حساب کاربری

Fields marked with an asterisk (*) are required.
Name
نام کاربری
رمز عبور *
تکرار رمز عبور *
پست الکترونیکی *
تکرار پست الکترونیکی *

استفاده از الگوهای داده کاوی اطلاعات آبی در بهره وری آب

 

1datam

حامد اکبری: تغییرات شرایط اقلیمی زمین و خشکسالی های دامنه دار در نقاط مختلف جهان مدتی است که تصمیم گیران و سیاستگذاران حوزه های مختلف و مرتبط با آب اعم از آب شرب شهری و آب مصرفی آبیاری کشاورزی را به فکر چاره اندیشی فوری برای این معضل که می توان نام بحران بر آن گذاشت، انداخته است.

سهم بالای مصرف آب تازه در حوزۀ آبیاری کشاورزی از کل آب مصرفی کشورها که عددی در حدود 70% تا 80% است لزوم اهمیت صرفه جویی آب در مصارف کشاورزی را جدی کرده و موضوع بهره وری مصرف آب از مهمترین دغدغه های کارشناسان و پژوهشگران حوزه آب و محیط زیست و همچنین دولت ها و سیاستگذاران به شمار می آید.

ضریب بالای هدر رفت آب مصرفی آبیاری کشاورزی که نسبت به اقلیم های مختلف عددی بین 20% تا 40% از کل، در غالب تبخیر سطحی و جذب در زمین، و آبیاری اضافی است، باعث شده که پژوهشگران این حوزه برای طراحی الگوهای صرفه جویی و بهره وری آب از ابزارهای مختلف بهره ببرند . از مهمترین این ابزارها ، تکنیک ها و ابزارهای داده کاوی آب است.

استرالیا یکی از کشورهای پیشتاز در حوزه بهره وری آب و مدیریت مصرف آب به دلیل اهمیت بالای کشاورزی ملی در جهان است. کشور استرالیا در برهه های مختلف تاریخی دست به اقدامات مهمی در اصلاح ساختار کشاورزی و باغداری و ژنتیک زده است که بررسی آن از وظایف این یادداشت نیست.

یکی از اقدامات نوآورانۀ کشور استرالیا با همکاری دانشگاه Charles Sturtو موسسه Centre for Research in Complex Systems (CRiCS)،استفاده از تکنیک های داده کاوی برای پیش بینی نیازهای آبیاری بوده که شرح آن در مقاله ای به نام ( ارزیابی کارایی متدهای مختلف داده کاوی در پیش بینی نیازهای آبیاری)(1) منعکس شده در این مقالۀ نسبتاً مفصل گزارش تجربه ای که نمونه های مقایسه ای داده کاوی اطلاعات آب با میزان مصرف انجام شده بود تشریح شده است.

این گزارش در قسمت روش شناسی متدهای مرسوم داده کاوی اطلاعات که معمولاً درخت تصمیم، شبکه مصنوعی عصبی، درخت های چندگانه، پشتیبانی ماشین برداشت، پیش بینی براساس تبخیر، رگرسیون لجستیک در حوزۀ آبیاری کشاورزی معرفی و نتایج طرح را شرح داده .

در قسمت بعدی گزارش مطالعات میدانی و بانک داده های آبی پروژه را معرفی و تشریح کرده و در مرحلۀ بررسی نتایج آزمایش به نتایج جالبی رسیده که در قسمت نتیجه گیری مفصلاً توضیح داده است .

از آنجا که نگارنده قصد انعکاس کامل مقاله را در غالب ترجمه ندارد و وظیفۀ این یادداشت را معرفی یک نمونۀ موفق داده کاوی اطلاعات آب در دنیا به هدف طرح پیشنهاداتی برای اقلیم ایران که در وضعیت ناهنجار آبی و مدیریت مصرف آب قرار دارد، می داند، نقطۀ عزیمت بحث را ارائه خلاصه ای از نتیجه گیری مقاله مذکور قرار داده است .

مجریان طرح در قسمت نتایج، هدف اصلی طرح (پروژه) را که فروتنانه یک آزمایش معرفی کرده اند پیش بینیِ کاراییِ مدل های متفاوت دیتا ماینینگ در موضوع پیش بینی تقاضای آب مصرفی آبیاری را دستور کار قرار داده اند.

این مدل ها عبارتست از : DT , ANN, Sys for, SVM, Logesticregresionو در ادامه توضیح داده اند که این مطالعه کارایی اثرات تکنیک های مختلف داده کاوی را بررسی کرده است. کار جدیدی که در این گزارش انجام شده این است که مدل Sysfor را با بقیه تکنیک های طبقه بندی و داده هایی از پیش پردازش شده برای اولین بار مقایسه کرده است .

نتایج نشان داد که تفاوت کمی بین پیش بینی هایی که مدل های مختلف استخراج داده وجود دارد و در نهایت تکنیک sysfor 78% صحت پیش بینی بهترین الگو معرفی شده و بعد از آن درخت تصمیم با 74% صحت پیش بینی و با SVM 64% صحت پیش بینی در مرحله های بعد قرار دارند.

در گزارش ذکر شده که نتایج محاسبات انجام گرفته با 3 مدل راستی آزمایی تقاطعی اطلاعات تائید شده و همچنین دقت پیش بینی مقدار مصرف آب توسط الگو های داده کاوی در مقایسه با میزان واقعی مصرف آب Sysfor را بهترین مدل با 5/97% صحت و در رتبه بعد درخت تصمیم با 96% و نکته ای که برای پژوهشگران جال بوده اینکه مدل ANN بهتر از SVM توانسته با 955 صحت پیش بینی پیشی بگیرد. مدل های SVM و رگرسیون لجستیک و روش سنتی ETC به ترتیب با 78% ، 75% و 77 % دقت پیش بینی داشته اند .

بنابراین نتایجی که در گزارش پیشنهاد شده استفاده از مدل Sysfor، درخت تصمیم و ANN برای پیش بینی تقاضای آبیاری است و اظهار امیدواری کرده که با تکمیل و توسعۀ داده ها و الگوها می توان پیش بینی هایی به مراتب قدرتمند تر از اطلاعات مرتبط آب آبیاری ارائه کرد که برای کشاورزان و سیاستگذاران آب در بیشینه کردن بهره وری آب بسیار مفید است و در انتها کمبود شاخص های موثر در پیش بینی تقاضای آب مصرفی زمین های کشاورزی ، اطلاعات و داده های مرتبط با جذب و نشت آب، رطوبت خاک و بعلاوه بررسی مصرف آب زمین زراعی در زمان برداشت محصول معرفی کرده است.

در ادامۀ این یادداشت نگارنده قصد دارد با معرفی فهرست الگوهای مختلف داده کاوی اطلاعات آب موانع پیش روی شبیه سازی داده کاوی آب برای کشور ایران رابررسی کند.

لازم بذکر است تهیه کنندگان گزارش مذکور درتشریح مراحل انجام پروژه هر کدام از الگوها را بررسی کرده اند و مطالعۀ پیرامون مبانی ریاضی الگوهای مطروحه را به مطالعه خوانندگان ارجاع داده اند .

معرفی اجمالی الگوها ( مدل های داده کاوی )

1-   Decision Tree / DT / درخت تصمیم

2-   Artificial neural Networks / ANNs / شبکه های عصب مصنوعی

3-   Systematically developed forest / sysfor / جنگل توسعه یافته سیستماتیک ( برای درختان متعدد)

4-   Support Vector Machine / SVM / ماشین بردار پشتیبان

5-   Logistic Regression / رگرسیون لجستیک

6-   Evapotranspiration / ETc / روش سنتی تبخیر و تعریق

بخش اعظم و محتوای غالب گزارش به تشریح روش ایجاد و استفاده از مدل های مذکور و فرآیند عدد گذاری و جداول مقایسه ای و نرم افزار مدلسازی و نتایج آماری اختصاص دارد که در انتها با مقایسه عددهای نتایج بدست آمده با مقدار واقعی مصرف آب زمین های زراعی نتیجه گیری که در صدر یادداشت ذکر کردیم حاصل می شود. مطالعه و بررسی مقالۀ مذکور به غیر از وظیفۀ مقاله که ارزیابی کارکرد و مقایسۀ مدلهای مختلف داده کاوی آب در پیش بینی آب مصرفی زراعی است، نکات مهمی را در فرآیند داده کاوی مطرح می کند که هدف نگارنده از انعکاس مقاله و تحشیه نویسی پیرامون آن ناظر بر آن هاست.

نخست استفادۀ تهیه کنندگان مقاله از اصطلاحPreprocessed data set است که عبارتست از داده های آماده و راستی آزمایی شده و منقح شدۀ موجود از زمین های زراعی CIA ( منطقه گزارش گیری کشاورزی در استرالیا) است. اطلاعات و داده هایی که خوراک اطلاعاتی هر مدل داده کاوی در هر حوزه ای است و بدون آن هیچ فرآیند داده کاوی محقق نشده و طبیعتاً از نتایج آن هم نمی توان بهره برد.

تکنیک های داده کاوی هیدرولوژیکی در حال گسترش است و ایجاد ظرفیت تولید دانش و تدوین الگوهای جدید داده کاوی بومی نیز از الزاماتی است که سیاستگذاران می بایست از دانشگاه ها و پژوهشگران و مدیران مرتبط با حوزۀ آبی کشور بخواهند.

تدوین الگوهای جدید از کشف الگوهای پنهان بوجود می آید و عملاً نتایج داده کاوی های جدید و متنوع و معنی دار و قابل استفاده که بتوان از آن به عنوان ابزار در بهره وری آب استفاده کرد بدون در دست داشتن داده های معتبر قبل از انجام داده کاوی، حین و بعد از انجام داده کاوی میسر نخواهد بود. داشتن مجموعه های داده های راستی آزمایی شده و خودروزآمدگر از الزامات حوزۀ وسیع داده کاوی است .

آنچه از این گزارش در این مرحله نیازمند توجه است وجود اصطلاحاً دیتا ست های معتبر برای هر موضوع و در مرحلۀ خردتر و به عنوان مثال در این گزارش وجود دیتا ست های مستقل برای هر قطعه زمین زراعی است. معادل پیشنهادی نگارنده برای Data setها در متون داده کاوی به جای انبارۀ داده یا بانک اطلاعات که مفاهیمی پر مناقشه و پر بسامد و دارای هم پوشانی تکنیکی فراوان است . اصطلاح « ابر اطلاعاتی » است.

پژوهشگران در این گزارش معتقدند، ابزارهای تحلیلی مانند درخت تصمیم و شبکه های عصبی، منطق فازی، هوش مصنوعی، مجموعه های سازمان یافته لایتغیر و الگوریتم های ژنتیک برای انجام طبقه بندی، پیش بینی، خوشه بندی، خلاصه سازی و بهینه سازی که از وظایف همیشگی داده کاوی هاست بدون داشتن ابرهای اطلاعاتی معتبر و روزآمد مستقل مفید نخواهد بود. آنها ابرهای اطلاعاتی را از سه مرجع مختلف دریافت و با هم قطع دادند و نتایج منقح شده و راستی آزمایی شده را مبنای داده کاوی قرار داده اند .

در قسمت دوم گزارش که شرح وارد کردن داده ها و مدل سازی در الگوهایی که پیشتر فهرستی از آنها ذکر شد مفصلاً بررسی شده که در وظایف این یادداشت نمی گنجد. ( علاقمندان می توانند به مقالۀ Evaluating the Performance of Several Data Mining Methods for

Predicting Irrigation Water Requirementرجوع کنند. )

در بخش سوم گزارش مختصات جغرافیایی و اطلاعاتی منطقۀ مورد بررسی و داده کاوی بررسی شده که اجمالاً می توان به نام منطقه (CIA) Coleambally Irrigation area اشاره کرد که از مهمترین مناطق زراعی آبیاری استرالیا است ، در حوزۀ رودخانه Murrumbidgee در 650 کیلومتری جنوب سیدنی در منطقه ریورینا، ناحیه ولز جنوبی جدید واقع شده و از حوزۀ آبریز رودخانه تغذیه می کند. ناحیه GIA حدود 79000 هکتار ناحیه آبیاری فشرده و حدود 325000 دورتر از دهانه و ناحیۀ آبیاری پراکنده دارد و از 495 قطعه زمین زراعی تشکیل شده است که خشکسالی اخیر و تغییر الگوهای آب و هوا در این منطقه دلیل اصلی تعریف پروژۀ داده کاوی برای اقدامات مدیریتی جدید برای مدیریت مصرف آب و بهره وری آب بوده است.

سطح اول، داده های مرتبط بازمین های زراعی منطقه CIAکه براساس سال، فصل و ماه طبقه بندی شده است. سطح دیگر داده های مربوط به آبگیری روزانه و ساعتی، اطلاعات هواشناسی و سنجش های منطقه ای ملی (از راه دور) و سطح سوم، داده های سنتی مرتبط با ETc استفاده شده است.

ابر اطلاعاتی که از تجمیع و تقطیع داده ها برای هر زمین زراعی تشکیل شده است به اقلام اطلاعاتی زیادی مجهز است از جمله حداقل و حد اکثر دما، سرعت باد، رطوبت، بارش ها، تابش خورشیدی در ترکیب با نوع خاک، نوع محصول و آب اطلاعات مرتبط با اطلاعات محصول و اطلاعات خاک «موضوعی» هستند و بقیه دارای استانداردهای «عددی» می باشند.

از مهم ترین نتایج پروژه اجرا شده ایجاد یک وب سرویس پشتیبان تصمیم گیری و سیاست گذاری (Web based Decision support) به نام DSS که متشکل از پایگاه های داده و مجموعه ای از مدل های مختلف داده کاوی اطلاعات آب و کشاورزی است که به کاربران (کشاورزان، مدیران آبیاری و سیاست گذاران ) دسترسی هایی به داده ها و نتایج داده کاوی ها موجود است. در ضمن کشاورزان و مدیران آبیاری می توانند به سایت مراجعه کنند و مقدار دقیق آب مصرفی زمین های زراعیشان را تا 7 روز آینده دریافت کنند .

گزارش های متعدد مرتبط با CIA تائید می کنند که استفاده از خدمات داده کاوی DSS که با استفاده از الگوهای داده کاوی چندگانه و داده های مرتبط با وضعیت آب و هوایی و هوا شناسی و جغرافیایی و با تحلیل داده ها قدیمی (رکوردهای ماهها و سال های قبل ) تولید می شود نقش موثری در مدیریت ترافیک مصرف آب زراعی و بهینه سازی زمان تخصیص آب در ساعات مختلف که از هدر رفتن کمتر آب برخوردار باشند و تناسب بندی آبیاری با توجه به نیاز زمین و محصول و فصل ها داشته است.

نتایجی که می توان با پژوهشی که شرح آن رفت در ارتباط با ظرفیت های استفاده از داده کاوی برای بهره وری آب در کشور ایران بدست آورد ذیل عناوین زیر تعریف می شود :

-        برداشت و ثبت اطلاعات آبی و آبیاری (ابر اطلاعات آبیاری)

-        برداشت و ثبت اطلاعاتی زمین های کشاورزی ( ابر اطلاعاتی زمین های زراعی)

-        برداشت و ثبت اطلاعات جغرافیایی و خاک ( ابر اطلاعاتی خاک)

-        برداشت و ثبت اطلاعات هوا شناسی ( ابر اطلاعاتی زمانی / مکانی هواشناسی )

که وجود راستی آزمایی و روزآمدسازی این ابرهای اطلاعاتی فرصتی بی نظیر و دائمی استفاده از داده کاوی ها با الگوهای استاندارد شده و تجربه شده برای مدیریت مصرف آب به بهره وری آب در کشور را فراهم خواهد کرد .

از موضوعات مکمل این مباحث می توان به مکانیسم و ابزارها و اصطلاحاً موتورهای برداشت و راستی آزمایی و روزآمد سازی و ابر ساز اطلاعات اشاره کرد که در جدیدترین تکنیک های روز دنیا معمولاً یا استفاده از اپلیکیشن های همراه و رایانش ابری انجام می شود.

از دیگر موضوعات مرتبط موضوع « آب مجازی » Virtual Water است که در صورت وجود ابرهای اطلاعاتی زمین های کشاورزی و اطلاعات مرتبط و استعدادهای خاکی و اقلیمی در قطع دادن با نیازهای بازار کشور، با استفاده از مدل های ساده داده کاوی می توان نقشه پیشنهاد بهینه ترین محصول را هم از وجه اقتصادی و هم از وجه بهره وری آب به سیاست گذاران، تصمیم گیران و همچنین به کشاورزان پیشنهاد کرد و موضوع مرتبط دیگر اقتصاد اطلاعات آبی و کشاورزی است . از نتایج مهم داده کاوی های اصولی و مبنایی براساس داده های پیش فرض صحیح ، تولید دانش مرتبط است و دانش به مثابه دارایی از مهم ترین ارش های افزوده این رشته می باشد. اقتصاد اطلاعات آبی/ کشاورزی اعم از فرصت های اقلیمی برای سرمایه گذاری، هدایت گری اقتصادی کشاورزی کشور، پیش فروش های هدفمند، تهاتر محصولات، تهاتر اطلاعات آب کشور با کشورهای هم مرز منطقه از ظرفیت های اقتصادی داده کاوی اطلاعات آب است.

تماس با ما

جهت ارتباط با مدیریت، ارسال انتقادات و پیشنهادات و نیز ارسال مقالات و اخبار حوزه سیاست گذاری می توانید با نشانی الکترونیکی زیر تماس حاصل فرمایید .

info@ippra.com

ایپرا تلاش خواهد کرد، در کمترین زمان، به مکاتبات شما پاسخ داده و ترتیب اثر دهد.

درباره ما

 تارنمای «تجزیه و تحلیل سیاست گذاری عمومی» (ایپرا/Ippra) پایگاهی تخصصی است جهت استفاده اساتید، دانشجویان و علاقه مندان حوزه سیاست گذاری عمومی که با هدف توسعه و ترویج گرایشات سیاست گذاری در حوزه فرهنگ، سلامت، علم، صنعت و تجارت فعالیت می کند. در این نشانی اینترنتی می توانید خبرهای سیاست گذاری داخل و خارج از کشور را دنبال و نیز مقالاتی در زمینه بهترین نمونه های سیاست گذاری ایران و سایر نقاط جهان را، مطالعه کنید. ایپرا همچنین، برگزاری دوره های آموزشی و پژوهشی، کلاس ها و مجموعه های کارگاهی مرتبط با این حوزه را برای ادارات، سازمان ها و نهادهای دولتی و خصوصی تضمین می کند.