تکنیک های داده کاوی

pooneh12345

عضو جدید
کاربر ممتاز
تکنیک های داده کاوی
درحال حاضر چند تکنیک عمده داده کاوی ایجاد و در پروژه های اخیر داده اوی مورد استفاده قرار گرفته است که شامل:
انجمن-طبقه بندی-خوشه بندی-پیش بینی و الگوهای متوالی می شود.که به طور کوتاه همراه با مثال بیان می گردد.

انجمن
انجمن یکی از شناخته شده ترین تکنیک های داده کاوی است.در روش انجمن»یک طرح براساس روابط آیتم های مشخص بر روی دیگر آیتم ها طی یک تراکنش مشابهه کشف می شود.برای مثال»تکنیک انجمن برای آنالیز سبد خرید استفاده می شود برای تشخیص این مطلب که کدام محصولات بطور مرتب توسط مشتری با هم خریداری شده.براساس این داده ها ی تجاری می توان یک مبارزه بازاریابی براساس فروش بیشتر برای سود بیشتر را اجرا کرد.

طبقه بندی
طبقه بندی یک تکنیک کلاسیک در داده کاوی است که براساس هوش مصنوعی بنیان شده است.در واقع طبقه بندی برای دسته بندی آیتم ها در مجموعه ای از داده ها که قبلا کلاسه بندی شده و ویژگی های آن مشخص شده کاربرد دارد.تکنیک طبقه بندی از متدهای ریاضی مثل درخت تصمیم گیری»برنامه یزی خطی»شبکه های عصبی و آمار بهره می جوید.برای مثال:ما میتوانیم طبقه بندی را در کاربرد هایی که"رکوردهای همه کارمندانی که شرکت را ترک کرده اند داده و پیش بینی کنیم که احتمالا کدام یک از کارکنان فعلی قصد ترک شرکت را دارند"است به کار ببنیم.در این مورد»ما رکوردهای کارمندان رابه دو گروه"رفتنی"و"ماندنی"تقسیم می کنیم و بعد می توانیم از نرم افزار داده کاوی خود بخواهیم تا کارمندان را در این دو دسته طبقه بندی کند.

خوشه بندی
[h=2]خوشه بندی تکنیکی از داده کاوی است که خوشه های معنی دار یا پر استفاده از آیتم هایی که خصوصیات مشابه دارند را می سازد و از تکنیک های اتوماتیک بهره می جوید که با تکنیک طبقه بندی متفاوت است.تکنیک خوشه بندی»کلاس ها را تعریف می کند و آیتم ها را در آن قرار می دهد»درحالیکه در تکنیک طبقه بندی آیتم ها در کلاسهای از پیش تعیین شده قرار می گیرند.برای روشن تر ساختن مفهوم»ما یک کتابخانه را در نظر می گیریم.در یک کتابخانه»کتب با موضاعات مختلفی در دسترس است.چالش این است که چطور این کتاب ها را قرار دهیم تا خواننده بتواند چندین کتاب را در یک موضوع مشخص بدون هیچ مشکلی داشته باشد .با استفاده از تکنیک خوشه بندی»ما می توانیم کتبی را شباهاتی با هم دارند در یک خوشه قرار دهیم و آن را یک لیبل با معنی مشخص کنیم.اگر خواننده بخواهد یک کتاب را در یک موضوع استفاده کند»جای اینکه کل کتابخانه را بگردد فقط به قفسه مورد نظرش مراجعه کرده و آن را می یابد.[/h][h=2]پیش بینی[/h][h=2]تکنیک پیش بینی همانطور که از نامش پیداست»رابطه بین متغییر های مستقل»متغییرهای غیر مستقل و متغییرهای مستقل و غیر مستقل را می یابد.برای مثال:این تکنیک می تواند در فروش مورد استفاده قرار گیرد تا سود را برای آینده پیش بینی کند. اگر که ما فروش را به عنوان یک متغییر مستقل در نظر بگیریم»سود می تواند یک متغییر وابسته باشد.بعد بر مبنای پیشینه فروش و اطلاعات سود»می توانیم یک رگرسیون درخور برای پیشبنی سود ترسیم کنیم.[/h][h=2]الگو های متوالی[/h][h=2]آنالیز الگوهای متوالی یکی از تکنیک های داده کاوی است که تشابه الگوها در تراکنش داده در یک دوره کسب و کار را دنبال می کند.الگوهای آشکار برای آنالیز تجاری بیشتر استفاده می شود روابط بین داده ها تشخیص داده شود[/h]
 

Drago

پیشکسوت فعال فناوری اطلاعات
کاربر ممتاز
بچه ها داده کاوی جزو تخصص های ماست یا بچه های کامپیوتر؟
 

danialfx

عضو جدید
کاربر ممتاز
بچه ها داده کاوی جزو تخصص های ماست یا بچه های کامپیوتر؟


به نظر من بیشتر میتونه جزو تخصص های بچه های علوم کامپیوتر و مهندسی نرم افزار باشه.

البته اگه برای رشته ایتی تعاریف داده ها رو (مثل سازماندهی و جمع اوری و طبقه بندی داده ها) هم داشته باشیم. میتونه جزو تخصص های بچه های ایتی هم باشه. که البته من زیاد این تعاریف رو قبول ندارم !!
 
آخرین ویرایش:

aliie62

عضو جدید
داده کاوی

داده کاوی

به نظر من بیشتر میتونه جزو تخصص های بچه های علوم کامپیوتر و مهندسی نرم افزار باشه.

البته اگه برای رشته ایتی تعاریف داده ها رو (مثل سازماندهی و جمع اوری و طبقه بندی داده ها) هم داشته باشیم. میتونه جزو تخصص های بچه های ایتی هم باشه. که البته من زیاد این تعاریف رو قبول ندارم !!

با سلام،
داده کاوی تلفیقی از حوزه های مختلف هستش که مهمترین اونا آمار و یادگیری ماشین هستش (2003, Kantardzic). از بعد فنی پیاده سازی داده کاوی ممکن هستش که بچه های کامپیوتر قوی تر عمل کنند؛ البته بچه های رشته های دیگر هم می تونند در بعد فنی قوی باشند. اما از لحاظ شناخت مسئله، تحلیل آن و ارائه متدولوژی مناسب بچه های IT و حتی صنایع قوی تر هستند و این جزء ذات رشته تحصیلیشون هست. در مجموع در یک پروژه داده کاوی افراد با تخصص های مختلف حضور دارند.
 

JUMONG360

کاربر فعال تجارت الکترونیک
بچه ها داده کاوی جزو تخصص های ماست یا بچه های کامپیوتر؟
دوستان من این تاپیک رو ندیده بودم جای دیگه تاپیک با همین عنوان زدم.خوبه تو همین تاپیک ادامه میدیم.
اما سوال شما رو با قاطعیت میگم آی تی.الان تقریبا اکثر درس های ما در رابطه با همین داده کاوی هست(گرایشم رو هم که گفتم تجارت الکترونیک میتونید سر فصل هاشم ببینید)
 

pooneh12345

عضو جدید
کاربر ممتاز
ممنون از توجه همه تون
این مشق درس مبانی آی تی مون بود
ترجمه اش کردم از رو یه متن گفتم اینجا هم بذارم
بنظر من اصلا مهم نیس که به چه رشته ای بیشتر ربط داره
مهم اینه که خیلی چیز باحال و بدرد بخوریه
 

hamseda1986

عضو جدید
منبع

منبع

سلام، میتونید یه چند تا منبع بهم بگید که این تکنیک های داده کاوی را در آن گفته باشه؟

ممنون
 

1star1

عضو جدید
سلام، من در مورد گراف کاوی (کاوش زیرگراف های تکراری)کار میکنم کسی فایل غارسی داره کمکم کنه؟
با تشکر
 

momahdavi

عضو جدید
انتشارات ساحر یه کتابی درباره تکنیک های داده کاوی در نرم افزار کلمنتاین ارائه کرده.میتونه کمکتون کنه.
 

samigorgan

عضو جدید
سلام میدونم خیلی وقته از این تایپیک میگذره و لی شاید اطلاعات من بدردتون بخوره : من این درسو پاس کردم و سمینار و موضوع پایان نامم روی داده کاوی هستش. همونطور که می دونید و از اسمش پیداس ما برای اجرای عملی داده کاوی به یه سری داده نیاز داریم که من کارم رو روی داده های پزشکی شروع کردم که میشه حوزه medical data mining. واسه شروع بگم که اگه بخاین مفاهیم رو تو این درس متوجه بشین کتاب داده کاوی و کشف دانش انتشارات علم و صنعت که یکی از نویسندههاش دکتر سمیه علیزاده هستش و اسه شرع خوبه چون هم فارسیه و هم به صورت خلاصه که بیشتر مطالبش ترجمه دو متاب بعدی که معرفی خواهم کرد. اولی کتای آقای تن و بعدی کتاب آقای هن . همونطور که گفتم باید تو اجرای عملی یه سری داده داشته باشی مثلا اطلاعات فروش یه شرکت یا سازمان دولتی و یا اطلاعات پزشکی که گیر آوردنش بسیار سخته. با چند تا نرم افزار میتونید کار کنید اولی و معروف ترینش که مخصوص data mining اسمش clementine بعدی نرم افزار صثنش و با نرم افزار معروف مطلب هم میتونید یه سری الگوریتم های داده کاوی رو اجرا کنید. مهم ترین مرحله توی داده کاوی ÷یش ÷ردازش داده هست که بحثش خیلی مفصله. واون دوستایی که میگن مال نرم افزاره اشتباه میکنن. اگه از نظر الگوریتمی بخواین مخصوص رشته هوش مصنوعیه چرا که از الگوریتم های machine learning استفاده میکنه ولی پروژه داده کاوی از اونجا که از اسمش معلومه مخصوص بچه های آیتی و مخصوصا گرایش مدیریت سیستم های اطلاعاتی که توی دانشگاه های سراسری فک کنم فقط خواجه نصیر دوره روزانه و شبانه اون رو تو ارشد داره.
 

samigorgan

عضو جدید
اسم دو تا کتاب رو یادم رفت Han, J. and Kamber, M. 2006. data mining conceps and techniques . Morgan kaufman و Tan, P. N., Steinbach, M. and Kumar, V. 2006 introduction to data mining Addison Wesley . نرم افزار ها هم یه بار دیگه میگم ( clementine --- weka ---matlab) نرم افزار clementine خیلی آسونه و اگه مفاهیم رو بلد باشین راحت از رو help نرم افزار میتوید یاد بگیرید من با بعضی الگوریتم هاش کار کردم کسی مشکلی داشت من میتونم تا حدی کمکش کنم.
 

Similar threads

بالا