کارگاه مجازی داده کاوی برگزار شد
بیست و ششمین کارگاه مجازی پژوهش با محوریت "داده کاوی" برگزار شد.
به گزارش روابط عمومی دانشگاه علوم پزشکی تهران دفتر امور ایثارگران، به همت مرکز تحقیقات آسیب دیدگان جنگ بیست و ششمین کارگاه مجازی پژوهش با موضوع داده کاوی در پژوهش برگزار شد.
در این کارگاه که جمعه 17 دی 1400 با شرکت تعدای از اعضای هیئت علمی دانشگاه برگزار شد، دکتر محمد رضاپور ، عضو هیئت علمی وزارت علوم، تحقیقات و فناوری در خصوص داده کاوی گفت: "داده کاوی" یا "DATA MINING " به زبان ساده فرایندی برای تبدیل داده های خام به اطلاعات مفید است. از طریق داده کاوی می توان حجم عظیم داده ها را جستجو کرد و از اطلاعات بدست آمده، دانش درون آن را کشف کرد.
وی ادامه داد: ویژگی های اصلی داده کاوی کشف اتوماتیک الگوها در انجام پروژه های داده کاوی، پیش بینی احتمالی نتایج ، خروجی ها و تولید اطلاعات اجرایی و مفید است.
دکتر رضاپور جمع آوری با استفاده از فهم کسب و کار داده ها (Business Conception & Data Collecting)، پیش پردازش داده ها (Pre-Processing) ، استخراج دانش با استفاده از الگوریتم ها (Running Algoritms & Extract Knowledge)، ارزیابی نتایج به همراه اثبات صحت و دقت نتایج (Evaluation the Results) و استفاده از دانش کشف شده (Using Discovered Knowledge) را از جمله مراحل داده کاوی عنوان کرد.
وی در ادامه با اشاره به اینکه(Cross-Industry Standard Process for Data Mining) "CRISP" یکی از متداولترین فرآیندهای استاندارد برای انجام پروژه داده کاوی است، تصریح کرد: این فرآیند شامل شش مرحله از جمله؛ درک کسب و کار، درک داده ها، آماده سازی داده ها، ارزیابی و استقرار نتایج که این مراحل متو ا لی نیست و امکان تغییر مراحل رفت و برگشت آنها وجود دارد، است.
دکتر رضاپور وظایف داده کاوی را از دو بعد پیش بینی و توصیفی بیان کرد و ادامه داد: الگوریتم های داده کاوی و یادگیری ماشین را به دو دسته یادگیری با ناظر Supervised Learningو یادگیری بدون ناظر Unsupervised Learning) تقسیم کرد.
وی مهمترین بخش داده کاوی را دسته بندی داده ها بوسیله درخت تصمیم گیری (Decision Tree) دانست و خاطر نشان کرد: در بررسی تاثیر روش درمان یک بیماری بیماری در یک طرح مطالعاتی، مهمترین ریسک فاکتورها مثل جنسیت که در بروز آن بیماری تاثیر بیشتری دارد. در اولین لایه (ریشه) و ریسک فاکتورهای بعدی مثل سن، سواد، شغل، دیابت که اهمیت کمتری در بروز آن بیماری دارند در سطح دوم یا همان لایه های بعدی و در سطح سوم یا برگ های درخت نتایج درمان بیماری با توجه به آن ریسک فاکتورها قرار می گیرند.
دکتر رضاپور ماتریس پیش بینی را برای ارزیابی و پیش بینی نهایی لازم دانست و گفت: از طریق معیارهای دقت یا صحت معیار پوشش یا فراخوان و یا معیار حساسیت پیش بینی های واقعی و غیرواقعی نمایان می شود.
وی تصریح کرد: ابزارهای بسیاری برای داده کاوی در دسترس قرار دارد مثل Rapid Miner ، SQL و ... که پس از یادگیری فرایند استفاده از آنها می توان در داده کاوی استفاده کرد.
در پایان کارگاه دکتر رضاپور به سوالات همکاران پاسخ داد.
توضیح اینکه کارگاه افزایش کیفیت زندگی یکشنبهها، کارگاه دانشگاه نسل سوم و چهارم و نقش آن در اشتغال در روزهای پنج شنبه و کارگاه موضوعات در ارتباط با پژوهش در روزهای جمعه از ساعت ۲۰ تا ۲۱ برگزار می شود.
نظر دهید