وبلاگ شخصی علیرضا پاک گوهر - مطالب خواندنی آماری

وبلاگ شخصی علیرضا پاک گوهر

این وبلاگ کشکولی است که در زمینه های عمومی و تخصصی به ارائه آرا می پردازد.تاچه قبول افتدوکه درنظراید

آموزش ضرايب همبستگي

درباره انواع ضرايب همبستگي مطالب اين آدرس را بخوانيد

آموزش ضرايب همبستگي


برچسب‌ها: ضريب همبستگي کرامر پيرسون اسپيرمن في لاندا کاپا ات
+ نوشته شده در  سه شنبه نهم اسفند 1390ساعت 3:1 PM  توسط علیرضا پاک گوهر  | 

ضريب توافق کاپا

براي آموزش ضريب توافق کاپا آدرس زير را پيشنهاد ميکنم.

آموزش ضريب توافق کاپا در پزشکي

 


برچسب‌ها: ضريب توافق کاپا, آموزش spss
+ نوشته شده در  سه شنبه نهم اسفند 1390ساعت 2:47 PM  توسط علیرضا پاک گوهر  | 

يک حديث از حضرت علي(ع) درباره استنباط آماري

 

من عاشق اين علي هستم که هرچي بخواهي از برکت کلامش متنعم ميشي

"بر آنچه واقع نشده، با آنچه واقع شده، برهان آور و با بررسي وقوع يافته ها، پيش بيني كن واقعه ها را، چرا كه امور جهان همانند هستند. "  امام علي  عليه السلام

منبع حديث

+ نوشته شده در  جمعه بیست و یکم بهمن 1390ساعت 9:54 AM  توسط علیرضا پاک گوهر  | 

سوال درباره شبکه عصبي

سلام آقای پاک گوهر عزیز
بنده دانشجوی کارشناسی ارشد آمار بیمه هستم و در حال تحقیق بر یکی از روشهای شبکه عصبی (support vector regression) , چند تا سوال برام پیش اومده که امیدوارم بتونید کمکم کنید
1- برای تعیین تعداد داده های آموزشی و تست از چه الگویی باید استفاده کرد ، مقالات زیادی رو خوندم اما هیچکدوم اشاره ای به این نکردند که چطور مثلا 100 تا داده آموزشی و 40 تا داده تست رو انتخاب کردند.
2- آیا چیزی در مورد (gradient projection)میدونید؟
با تشکر

پاسخ

سلام به شما

درباره اینکه معمولا چه تعدادی از داده ها باید در دسته آموزشی و چه تعدادی باید در دسته آزمایش قرار بگیرند استانداردی تعریف نشده است. یعنی نیازی به این کار نیست. شما می توانید هنگامی که داده های کمی دارید اصلا این تفکیک را انجام ندهید. به هرحال به منظورهای متعدد از جمله آنالیز حساسیت و غیره داده ها را دو دسته می کنند. در SPSS پيش فرض 70% آموزشي و 30% آزمايشي است.

در يک مقاله خواندم که پيشنهاد داده بود با توجه به تعداد متغيرهاي مستقل معياري در نظر گرفته شود. البته اين معيار تجربي بوده و مبتني بر استدلال رياضياتي نبود.

از دوستان ديگر خواهش ميکنم اگر پاسخي براي اين موضوع دارند آنرا در اختيار ما نيز قرار دهند و يا به صورت مستقيم با ايميل خانم محيا در ارتباط باشند mahya.jamshidiyan@yahoo.com

درباره سوال دوم چيزي نمي دانم البته گراديان يک روش رياضياتي براي تخمين است.

+ نوشته شده در  چهارشنبه دوم شهریور 1390ساعت 12:47 PM  توسط علیرضا پاک گوهر  | 

ضرايب همبستگي

 

آدرس هاي زير منابع مفيدي براي آشنايي با ضرايب همبستگي هستند:

سيسرو

دانشنامه اقتصاد و مديريت

 

+ نوشته شده در  دوشنبه بیستم تیر 1390ساعت 1:58 PM  توسط علیرضا پاک گوهر  | 

مدل يابي معادلات ساختاري

آدرس منبع: آدرس منبع

ليزرل يا مدل يابي معادلات ساختاري يک تکنيک تحليل چند متغيري بسيار کلي و نيرومند از خانواده رگرسيون چند متغيري است که به پژوهشگر امکان مي دهد مجموعه اي از معادلات رگرسيون را به گونه هم زمان مورد آزمون قرار دهد.

ليزرل يا مدل يابي معادلات ساختاري (Structural equation modeling: SEM)يک تکنيک تحليل چند متغيري بسيار کلي و نيرومند از خانواده رگرسيون چند متغيري و به بيان دقيق تر بسط "مدل خطي کلي"(General linear model) است. که به پژوهشگر امکان مي دهد مجموعه اي از معادلات رگرسيون را به گونه هم زمان مورد آزمون قرار دهد. مدل يابي معادله ساختاري يک رويکرد جامع براي آزمون فرضيه هاي ي درباره روابط متغير هاي مشاهده شده و مکنون است که گاه تحليل ساختاري کوواريانس، مدل يابي علّي و گاه نيز ليزرل(Lisrel) ناميده شده است اما اصطلاح غالب در اين روزها، مدل يابي معادله ساختاري يا به گونه خلاصه SEM است.(هومن ۱۳۸۴،۱۱)

از نظر آذر (۱۳۸۱) نيز يکي از قوي ترين و مناسب ترين روش هاي تجزيه و تحليل در تحقيقات علوم رفتاري و اجتماعي، تجزيه و تحليل چند متغيره است زيرا اين گونه موضوعات چند متغيره بوده و نمي توان آنها را با شيوه دو متغيري (که هر بار يک متغير مستقل با يک متغير وابسته در نظر گرفته مي شود) حل نمود.

«تجزيه و تحليل ساختار هاي کوواريانس» يا همان «مدل يابي معادلات ساختاري»، يکي از اصلي ترين روش هاي تجزيه و تحليل ساختار داده هاي پيچيده و يکي از روش هاي نو براي بررسي روابط علت و معلولي است و به معني تجزيه و تحليل متغير هاي مختلفي است که در يک ساختار مبتني بر تئوري، تاثيرات همزمان متغيره ا را به هم نشان مي دهد. از طريق اين روش مي توان قابل قبول بودن مدل هاي نظري را در جامعه هاي خاص با استفاده از داده هاي همبستگي، غير آزمايشي و آزمايشي آزمود.

● انديشه اساسي زيربناي مدل يابي ساختاري

يکي از مفاهيم اساسي که در آمار کاربردي در سطح متوسط وجود دارد اثر انتقال هاي جمع پذير و ضرب پذير در فهرستي از اعداد است يعني اگر هر يک از اعداد يک فهرست در مقدار ثابت K ضرب شود ميانگين اعداد در همان K ضرب مي شود و به اين ترتيب ، انحراف معيار استاندارد در مقدار قدر مطلق Kضرب خواهد شد. نکته اين است که اگر مجموعه اي از اعداد x با مجموعه ديگري از اعداد y از طريق معادله y=۴xمرتبط باشند در اين صورت واريانس y بايد ۱۶ برابر واريانس x باشد و بنابراين از طريق مقايسه واريانس هاي x و y مي توانيد به گونه غير مستقيم اين فرضيه را که y و x از طريق معادله y=۴x با هم مرتبط هستند را بيازماييد. اين انديشه از طريق تعدادي معادلات خطي از راه هاي مختلف به چند ين متغير مرتبط با هم تعميم داده مي شود. هر چند قواعد آن پيچيده تر و محاسبات دشوارتر مي شود. اما پيام کلي ثابت مي ماند. يعني با بررسي واريانسها و کوواريانس هاي متغيره ا مي توانيد اين فرضيه را که " متغيره ا از طريق مجموعه اي از روابط خطي با هم مرتبط اند" را بيازماييد.

توسعه مدل هاي علّي و همگرايي روش هاي اقتصادسنجي، روان سنجي و...

توسعه مدل هاي علّي متغير هاي مکنون معرف همگرايي سنت هاي پژوهشي نسبتا مستقل در روان سنجي، اقتصادسنجي، زيست شناسي و بسياري از روش هاي قبلا آشناست که آنها را به شکل چهارچوبي وسيع در مي آورد. مفاهيم متغير هاي مکنون (Latent variables)(در مقابل متغير هاي مشاهده شده (Observed variables)) و خطا در متغيره ا، تاريخي طولاني دارد. در اقتصادسنجي آثار جهت دار هم زمان چند متغير بر متغير هاي ديگر، تحت برچسب مدل هاي معادله هم زمان بسيار مورد مطالعه قرار گرفته است. در روان سنجي به عنوان تحليل عاملي و تئوري اعتبار توسعه يافته و شالوده اساسي بسياري از پژوهش هاي اندازه گيري در روانسنجي مي باشد. در زيست شناسي، يک سنت مشابه همواره با مدل هاي معادلات هم زمان (گاه با متغير هاي مکنون) در زمينه نمايش و طرح برآورده در تحليل مسير سر و کار دارد.

● موارد کاربرد روش ليزرل:

روش ليزرل ضمن آنکه ضرايب مجهول مجموعه معادلات ساختاري خطي را برآورد مي کند براي برازش مدل هاي ي که شامل متغير هاي مکنون، خطا هاي اندازه گيري در هر يک از متغير هاي وابسته و مستقل، علي ت دو سويه، هم زماني و وابستگي متقابل مي باشد طرح ريزي گرديده است. اما اين روش را مي توان به عنوان موارد خاصي براي روش هاي تحليل عاملي تاييدي، تحليل رگرسيون چند متغيري، تحليل مسير، مدل هاي اقتصادي خاص داده هاي وابسته به زمان، مدل هاي برگشت پذير و برگشت ناپذير براي داده هاي مقطعي/ طولي، مدل هاي ساختاري کوواريانس و تحليل چند نمونه اي (مانند آزمون فرضيه هاي برابري ماتريس کوواريانس هاي ، برابري ماتريس همبستگي ها، برابري معادلات و ساختار هاي عاملي و غيره) نيز به کار برد.

● نرم افزار ليزرل:

ليزرل يک محصول نرم افزاري است که به منظور برآورد و آزمون مدل هاي معادلات ساختاري طراحي و از سوي "شرکت بين المللي نرم افزار علمي" (Scientific software international (www.ssicentral.com)به بازار عرضه شده است. اين نرم افزار با استفاده از همبستگي و کوواريانس اندازه گيري شده، مي تواند مقادير بار هاي عاملي، واريانسها و خطا هاي متغير هاي مکنون را برآورد يا استنباط کند و از آن مي توان براي اجراي تحليل عاملي اکتشافي، تحليل عاملي مرتبه دوم، تحليل عاملي تاييدي و همچنين تحليل مسير (مدل يابي علت و معلولي با متغير هاي مکنون) استفاده کرد.

● تحليل عاملي اکتشافي و تاييدي:

تحليل عاملي مي تواند دو صورت اکتشافي و تاييدي داشته باشد. اينکه کدام يک از اين دو روش بايد در تحليل عاملي به کار رود مبتني بر هدف تحليل داده هاست. در تحليل اکتشافي(Exploratory factor analysis) پژوهشگر به دنبال بررسي داده هاي تجربي به منظور کشف و شناسايي شاخص ها و نيز روابط بين آنهاست و اين کار را بدون تحميل هر گونه مدل معيني انجام مي دهد. به بيان ديگر تحليل اکتشافي علاوه بر آنکه ارزش تجسسي يا پيشنهادي دارد مي تواند ساختارساز، مدل ساز يا فرضيه ساز باشد.

تحليل اکتشافي وقتي به کار مي رود که پژوهشگر شواهد کافي قبلي و پيش تجربي براي تشکيل فرضيه درباره تعداد عامل هاي زيربنايي داده ها نداشته و به واقع مايل باشد درباره تعيين تعداد يا ماهيت عامل هاي ي که همپراشي بين متغيره ا را توجيه مي کنند داده ها را بکاود. بنابر اين تحليل اکتشافي بيشتر به عنوان يک روش تدوين و توليد تئوري و نه يک روش آزمون تئوري در نظر گرفته مي شود.

تحليل عاملي اکتشافي روشي است که اغلب براي کشف و اندازه گيري منابع مکنون پراش و همپراش در اندازه گيري هاي مشاهده شده به کار مي رود. پژوهشگران به اين واقعيت پي برده اند که تحليل عاملي اکتشافي مي تواند در مراحل اوليه تجربه يا پرورش تستها کاملا مفيد باشد. توانش هاي ذهني نخستين ترستون ، ساختار هوش گيلفورد نمونه هاي خوبي براي اين مطلب مي باشد. اما هر چه دانش بيشتري درباره طبيعت اندازه گيري هاي رواني و اجتماعي به دست آيد ممکن است کمتر به عنوان يک ابزار مفيد به کار رود و حتي ممکن است بازدارنده نيز باشد.

از سوي ديگر بيشتر مطالعات ممکن است تا حدي هم اکتشافي و هم تاييدي باشند زيرا شامل متغير م علوم و تعدادي متغير مجهول اند. متغير هاي م علوم را بايد با دقت زيادي انتخاب کرد تا حتي الامکان درباره متغير هاي نام علوم ي که استخراج مي شود اطلاعات بيشتري فراهم ايد. مطلوب آن است که فرضيه اي که از طريق روش هاي تحليل اکتشافي تدوين مي شود از طريق قرار گرفتن در معرض روش هاي آماري دقيق تر تاييد يا رد شود. تحليل اکتشافي نيازمند نمونه هاي ي با حجم بسيار زياد مي باشد.

در تحليل عاملي تاييدي(Confirmatory factor analysis) ، پژوهشگر به دنبال تهيه مدلي است که فرض مي شود داده هاي تجربي را بر پايه چند پارامتر نسبتا اندک، توصيف تبيين يا توجيه مي کند. اين مدل مبتني بر اطلاعات پيش تجربي درباره ساختار داده هاست که مي تواند به شکل: ۱) يک تئوري يا فرضيه ۲) يک طرح طبقه بندي کننده معين براي گويه ها يا پاره تستها در انطباق با ويژگي هاي عيني شکل و محتوا ، ۳)شرايط م علوم تجربي و يا ۴) دانش حاصل از مطالعات قبلي درباره داده هاي وسيع باشد.

تمايز مهم روش هاي تحليل اکتشافي و تاييدي در اين است که روش اکتشافي با صرفه ترين روش تبيين واريانس مشترک زيربنايي يک ماتريس همبستگي را مشخص مي کند. در حالي که روش هاي تاييدي (آزمون فرضيه) تعيين مي کنند که داده ها با يک ساختار عاملي معين (که در فرضيه آمده) هماهنگ اند يا نه.

● آزمون هاي برازندگي مدل کلي

با آنکه انواع گوناگون آزمون ها که به گونه کلي شاخص هاي برازندگي(Fitting indexes) ناميده مي شوند پيوسته در حال مقايسه، توسعه و تکامل مي باشند اما هنوز درباره حتي يک آزمون بهينه نيز توافق همگاني وجود ندارد. نتيجه آن است که مقاله هاي مختلف، شاخص هاي مختلفي را ارائه کرده اند و حتي نگارش هاي مشهور برنامه هاي SEM مانند نرم افزار هاي lisrel, Amos, EQS نيز تعداد زيادي از شاخص هاي برازندگي به دست مي دهند.(هومن۱۳۸۴ ،۲۳۵) اين شاخص ها به شيوه هاي مختلفي طبقه بندي شده اند که يکي از عمده ترين آنها طبقه بندي به صورت مطلق، نسبي و تعديل يافته مي باشد. برخي از اين شاخص ها عبارتند از:

● شاخص هاي GFI وAGFI

شاخص GFI (Goodness of fit index )مقدار نسبي واريانس ها و کوواريانس ها را به گونه مشترک از طريق مدل ارزيابي مي کند. دامنه تغييرات GFI بين صفر و يک مي باشد. مقدار GFI بايد برابر يا بزرگتر از ۹۰/۰باشد.

شاخص برازندگي ديگر (Adjusted Goodness of Fit Index)AGFI يا همان مقدار تعديل يافته شاخص GFI براي درجه آزادي مي باشد. اين مشخصه معادل با کاربرد ميانگين مجذورات به جاي مجموع مجذورات در صورت و مخرج (۱- GFI) است. مقدار اين شاخص نيز بين صفر و يک مي باشد. شاخص هاي GFI و AGFI را که جارزکاگ و سوربوم (۱۹۸۹) پيشنهاد کرده اند بستگي به حجم نمونه ندارد.

● شاخص RMSEA

اين شاخص , ريشة ميانگين مجذورات تقريب مي باشد. شاخص (Root Mean Square Error of Approximation)RMSEAبراي مدل هاي خوب برابر ۰.۰۵ يا کمتر است. مدل هاي ي که RMSEA آنها ۰.۱ باشد برازش ضعيفي دارند.

● مجذور کاي

آزمون مجذور کاي (خي دو) اين فرضيه را مدل مورد نظر هماهنگ با الگوي همپراشي بين متغير هاي مشاهده شده است را مي آزمايد، کميت خي دو بسيار به حجم نمونه وابسته مي باشد و نمونه بزرگ کميت خي دو را بيش از آنچه که بتوان آن را به غلط بودن مدل نسبت داد, افزايش مي دهد. (هومن.۱۳۸۴. ۴۲۲).

● شاخصNFI وCFI:

شاخصNFI (که شاخص بنتلر-بونت هم ناميده مي شود) براي مقادير بالاي ۹۰/۰ قابل قبول و نشانه برازندگي مدل است. شاخص CFIبزرگتر از ۹۰/۰ قابل قبول و نشانه برازندگي مدل است. اين شاخص از طريق مقايسه يک مدل به اصطلاح مستقل که در آن بين متغيره ا هيچ رابطه اي نيست با مدل پيشنهادي مورد نظر، مقدار بهبود را نيز مي آزمايد. شاخص CFIاز لحاظ معنا مانند NFI است با اين تفاوت که براي حجم گروه نمونه جريمه مي دهد.

شاخص هاي ديگري نيز در خروجي نرم افزار ليزرل ديده مي شوند که برخي مثلAIC, CAIC ECVA , براي تعيين برازنده ترين مدل از ميان چند مدل مورد توجه قرار مي گيرند براي مثال مدلي که داراي کوچکترين AIC,CAIC,ECVA باشد برازنده تر است.(هومن۱۳۸۴ ،۲۴۴-۲۳۵) برخي از شاخص ها نيز به شدت وابسته حجم نمونه اند و در حجم نمونه هاي بالا مي توانند معنا داشته باشند.

منابع :
----------------------
aftab.ir
▪ هومن, حیدر علی.(۱۳۸۴).مدل یابی معادلات ساختاری با کاربرد نرم افزار لیزرل، انتشارات سمت، چاپ اول
▪ دلاور، علی- ویس کرمی،علی – زرین �
----------------------

کلمات کليدي :
----------------------
لیزرل-نرم افزار لیزرل-موارد کاربرد روش لیزرل-مدل یابی معادلات ساختاری-شاخص های GFI وAGFI-شاخص RMSEA-مجذور کای-شاخصNFI وCFI
----------------------

نام ثبت کننده مقاله : niazemarkazi1

+ نوشته شده در  سه شنبه سیزدهم اردیبهشت 1390ساعت 5:48 PM  توسط علیرضا پاک گوهر  | 

آزمون های ناپارامتری با MiniTab

 متن مناسب و آموزنده ای درباره آزمون های ناپارامتری با نرم افزار مینی تب

آزمون ناپارامتری به زبان فارسی

+ نوشته شده در  چهارشنبه بیست و چهارم شهریور 1389ساعت 8:54 PM  توسط علیرضا پاک گوهر  | 

لیست کنفرانسهای آمار

http://www.conferencealerts.com/statistics.htm

آدرس بالا لیست کنفرانسهای آمار را ارائه می کند.

احتمالا من در کنفرانس کویت مقاله بدهم. دوستانی که علاقمندند بگن با هم هماهنگ باشیم

08 Challenges in Statistics and Operations Research (CSOR2011) KUWAIT Kuwait

 

+ نوشته شده در  دوشنبه هشتم شهریور 1389ساعت 6:55 PM  توسط علیرضا پاک گوهر  | 

آموزش نرم افزار مطلب

برای استفاده دوستانی که علاقمند به یادگیری نرم افزار مطلب هستند دو لینک زیر را تقدیم می کنم.

آموزش مطلب 1

آموزش مطلب 2

اگر در این زمینه دوستانُ موضوعات آموزشی دیگری هم داشتند خوشحال میشوم به این وسیله در اختیار علاقمندان گذاشته شود.

+ نوشته شده در  دوشنبه هفتم تیر 1389ساعت 12:18 PM  توسط علیرضا پاک گوهر  | 

آشنایی با تحلیل مسیر

تحلیل مسیر یکی از مدلهای آماری تبیینی(نه پیش بینی) است که بر اساس روابط رگرسیونی بین متغیرها به منظور دستیابی اثر یکایک متغیرها( اعم از اثر مستقیم و غیر مستقیم) ارائه می گردد.

معمولا مدل تحلیل مسیر را با نرم افزار لیزرر انجام می دهند. این به ان معنا نیست که این نرم افزار تنها نرم افزاری است که این کار را میکند. یا آنکه نرم افزارهایی مانند اس پی اس اس قابلیت انجام چنین کاری را ندارد.

برای اطلاع خوب است بدانید اس پی اس اس برنامه ای با عنوان SPSS AMOS طراحی کرده است که تحلیل مسیر را مستقیما انجام می دهد.

برای کسانی که دوست دارند با SPSS تحلیل مسیر انجام دهند باید نوید آسان بودن کار با آن را بدهم.

بطور کلی در مدل تحلیل مسیر با ضرایب استاندارد رگرسیونی( وزنهای استاندارد شده مولفه ها) کار داریم.

برای اطلاع بیشتر می کوشم فایلهای آموزشی مرتبطی را لینک کنم باشد از آن استفاده ببرید

آموزش تحلیل مسیر path analysis

+ نوشته شده در  شنبه پنجم تیر 1389ساعت 4:7 PM  توسط علیرضا پاک گوهر  | 

یک نکته مهم درباره طرح آزمایشها از آقای احسان صباغیان درباره نظر آقای مهدی رشیدی

اگر فرض همگنی واریانس ها وجود نداشته باشه، اونوقت برآوردگرهای کمترین مجموع مربعات BLUE نخواهند بود. یعنی بهترین برآورد گر (نااریب و با کمترین واریانس ممکنه) نخواهند بود.
اما اگر فرض نرمال بودن رد شود، آزمون های صورت گرفته از اعتبار کافی برخوردار نیستند، اعم از آزمون معنی داری عوامل، فواصل اطمینان برای برآوردگرها و جدول تحلیل واریانس.
در نهایت این دو فرض به دو موضوع مختلف بر می گردن، یکی به برآورد پارامترها (همگنی واریانس) و دیگری به موضوعات آزمون کردن (نرمال بودن)
+ نوشته شده در  سه شنبه هجدهم خرداد 1389ساعت 3:28 PM  توسط علیرضا پاک گوهر  | 

نکته درباره طرح آزمایشها از دوست عزیزم مهدی رشیدی

در خصوص «طرح‌هاي آزمايشي» عنوان شده كه اگر نرمال بود آناليز واريانس و اگر نرمال نبود كروسكال واليس استفاده بشه در حالي كه به نظر من در آزمون آناليز واريانس چيزي كه بيشتر از نرمال بودن اهميت داره اينه كه واريانس‌ها همگن هستند يا نه و اگر همگن نباشند استفاده ازاين آزمون اشتباه بوده و مي‌بايست سراغ آزمون‌هاي ناپارامتري (كروسكال واليس) رفت. (نظر شما در اين خصوص چيه؟)
+ نوشته شده در  دوشنبه هفدهم خرداد 1389ساعت 12:21 PM  توسط علیرضا پاک گوهر  | 

آموزش bootstrap

سرکار خانم امیری برای دانستن درباره بوت استرپ اطلاعاتی خواسته اند که فایل زیر را ارسال کرده ام

salam aghaye pak gohar
man amiri hastam daneshjoye havashenasi.
be donbale tozihi baray raveshe bootstrap migashtam,ke matlabe kamele shoma ro khoshbakhtane peyda kardam.
ama moteasefane be sorate kamel baz nemishe,kheyli mamnon misham ke agar emkanesh hast baram befrestinesh.
mamnon misham agar mailamo javab bedin.
ba tashakor
amiri

آموزش بوت استرپ

+ نوشته شده در  دوشنبه سوم خرداد 1389ساعت 5:12 PM  توسط علیرضا پاک گوهر  | 

تحلیل مسیر چیست؟

درباره تحلیل مسیر می توانید به منابع زیر مراجعه کنید:

path Analysis review

1

2

3

۴4

5

6

7

8

09

  •  لطفا نظرات خود را هم بیان کنید

 

+ نوشته شده در  سه شنبه بیست و یکم اردیبهشت 1389ساعت 2:15 PM  توسط علیرضا پاک گوهر  | 

سوال درباره نحوه آزمون داده های رسته ای و رتبه ای

با سلام.وبلاگ خوبی دارید از اونجایی که در مورد spss نوشته بودید سوالی در مورد انتخاب یک آزمون دارم اگه همینجا راهنمایی کنید متشکر می شم.اگر ما یک متغییر باینری 500 نمونه ای داشته باشیم یعنی مثلا در 400 تا وقوع و در100 تا عدم وقوع داریم، در این حالت احتمال وقوع به کل نمونه ها، یک پنجم می باشد. اگر بخواهیم رابطه ی این متغییر باینری را با یک متغییر رتبه ای ببینیم بطوریکه متغییر رتبه ای ما مثلا از سه بازه مختلف تشکیل شده باشد بطوریکه احتمال وقوع در هر بازه مقداری مشخص می باشد. آیا آزمونی در spss داریم که با کمک از آن بتوانیم تفاوت معناداری را بین احتمال وقوع کل نمونه(یک پنجم) با احتمال وقوع در هر بازه بطور جداگانه مقایسه کنیم؟

برای مقایسه رابطه بین مولفه ها می توانید از آزمون جدول توافقی استفاده کنید. الان نمیتوانم بیشتر توضیح دهم گذاشتم در وبلاگ تا دوستان آماری هم نظرات خودشان را بدهند. فردا توضیح بیشتر میدهند.

این پاسخ یکی از دوستانم است که برای این سوال ارسال کرده

جناب آقای پاک گوهر
با همه احترامی که براتون قائلم چون دیدم جواب اشتباه دادید جواب درست را میذارم
دوست داشتید جوابتون را اصلاح کنید.
جدول توافقی استقلال را بررسی میکنه اونم برای متغیرهای رتبه ای
این به خاطر علاقه ام به استفاده درست از آماره و نه هیچ چیزه دیگه
من به همه وبلاگ ها و سایت های اماری که سراغ دارم به خاطر بروز شدن اطلاعات و چیزهای دیگه سر میزنم اگه نمیخواهید کسی سر بزنه مخصوصا من میتونید وبلاگ تون را محدود کنید که من نتونم بیام توش
برای بررسی چگونگی این رابطه باید از رگرسیون لجستیک و تحلیل ممیزی و یا لگ خطی استفاده کرد
مخصوصا رگرسیون لجستیک دقیقاَ جواب سوال را میده
اما برای تحلیل های پیشرفته تر میتونن از آزمون هایی که توی ناپارامتری هست استفاده کنند

 

اجواب کامل تر من:

برای سنجش روابطی مانند استقلال و وابستگی بین متغیرها از آزمون استقلال خی دو می توانید استفاده کنید. چون یکی از متغیرها رتبه ای است پس به نظر میرسه آزمون کندال مفید باشه . سعی میکنم در اولین فرصت درباره معیارهای سنجش علی بین متغیرها از قبیل کندال تاو بی  و کندال تاو سی و اسپیرمن و فی و .... توضیح دهم.

در صورتی که می خواهیم یک رده بندی و پیش بینی برای دو متغیر داشته باشیم روش رگرسیون لجستیک مولتی نامیال روش خوبی است.

در صورتی که می خواهیم تفاوت معنی دار آزمون کنیم. می توانیم از آزمون انوا یک طرفه استفاده کنیم. چون مقادیر ما نسبت هستند و نه تعداد به نظر اینکار نشد می آید ولی از نظر من از آنجا که می توان به نسبتها هم به دید یک مقدار فاصله ای نگاه کرد می توانیم از آنوا استفاده کنیم.

تحلیل ممیزی نیز یک روش دیگر کلاسه بندی است. البته در یک مقاله خواندم که روش لجستیک برای داده های با رسته کمتر بهتر از تحلیل ممیزی نتیجه می گیرد. و هرچه رسته ها افزایش یابند تحلیل ممیزی بهتر است.

+ نوشته شده در  چهارشنبه پانزدهم اردیبهشت 1389ساعت 10:8 AM  توسط علیرضا پاک گوهر  | 

یک مثال برای درخت تصمیم

به این مثال توجه کنید به نظرم مثال مناسبی برای یادگیری درخت تصمیم است.

decision tree learning

+ نوشته شده در  سه شنبه چهاردهم اردیبهشت 1389ساعت 2:8 PM  توسط علیرضا پاک گوهر  | 

Decision tree learning

اموزش یادگیری درخت تصمیم از دانشنامه ویکی پدیا

به ادامه مطلب مراجعه کنید.

 

+ نوشته شده در  سه شنبه چهاردهم اردیبهشت 1389ساعت 2:0 PM  توسط علیرضا پاک گوهر  | 

مفاهیم استنباطی برای توزیعهای یک نمونه ای

به لینک زیر مراجعه کنید:

lnference to one sample

+ نوشته شده در  یکشنبه پنجم اردیبهشت 1389ساعت 10:22 AM  توسط علیرضا پاک گوهر  | 

آشنایی با مفاهیم پایه ای استنباطی برآوردگرها و فواصل اطمینان

آشنایی با مفاهیم پایه ای استنباطی برآوردگرها و فواصل اطمینان

basic concept of Inference

+ نوشته شده در  یکشنبه پنجم اردیبهشت 1389ساعت 10:19 AM  توسط علیرضا پاک گوهر  | 

آشنایی با توزیعهای نمونه

برای آشنایی با توزیع های نمونه در آمار به آدرس زیر مراجعه کنید

آشنایی با توزیعهای آماری

+ نوشته شده در  یکشنبه پنجم اردیبهشت 1389ساعت 10:8 AM  توسط علیرضا پاک گوهر  | 

مروری بر احتمالات

برای آشنایی با احتمالات و مفاهیم آن به این آدرس که دوره آموزشی دانشگاه MBA آمریکا است مراجعه کنید

مروری براحتمالات

+ نوشته شده در  یکشنبه پنجم اردیبهشت 1389ساعت 10:4 AM  توسط علیرضا پاک گوهر  | 

توصیف و تحلیل داده ها با آمارهای توصیفی و نمودارها

 

برای آشنایی با خصوصیت آماره های توصیفی مانند میانگین و واریانس و نمودارها این دوره آموزشی دانشگاه MBA آمریکا را مطالعه کنید

 

Chapter 4: Summarizing & Exploring Data(Descriptive Statistics)Graphics! Graphics! Graphics!(and some numbers)

توصیف و تحلیل داده ها

+ نوشته شده در  یکشنبه پنجم اردیبهشت 1389ساعت 10:2 AM  توسط علیرضا پاک گوهر  | 

ٍآموزش مقدماتی مفاهیم آماری

 

سلام به دوستان

یه دوره آموزشی از دانشگاه MBA آمریکا درباره مقدمات آمار و مفاهیم احتمالاتی به زبان انگلیسی

لینک

ٍآموزش مقدماتی مفاهیم آماری

+ نوشته شده در  یکشنبه پنجم اردیبهشت 1389ساعت 9:55 AM  توسط علیرضا پاک گوهر  | 

مقایسه MSE در برآوردگرهای مختلف آنتروپی

یکی از روشهای مناسب برای تشخیص آنتروپی استفاده از معیارMSE است.

برای مطالعه بیشتر به لینک زیر مراجعه کنید:

مقایسه MSE در برآوردگرهای مختلف آنتروپی

+ نوشته شده در  چهارشنبه یکم اردیبهشت 1389ساعت 7:2 PM  توسط علیرضا پاک گوهر  | 

لینک آموزش شبکه عصبی را برای دوستان علاقمند گذاشته ام در صورتی که هنگام کار با شبکه عصبی اشکالی دارند می توانند با من در میان بگذارند. امیدوارم بتوانم کمکی بکنم. فقط خواهشا سوالات واضح و مشخص باشند و به طرح سوالات کلی نپردازید که مجال پاسخ دهی نیست

 

http://www.4shared.com/document/fFJAG1fu/SPSS_Neural_Network_170.html
آموزش شبکه عصبی با spss

+ نوشته شده در  سه شنبه سی و یکم فروردین 1389ساعت 10:58 AM  توسط علیرضا پاک گوهر  | 

آموزش شبکه عصبی با نرم افزار spss

+ نوشته شده در  سه شنبه سی و یکم فروردین 1389ساعت 10:54 AM  توسط علیرضا پاک گوهر  | 

اموزش شبکه عصبی با spss.17

 

بعضی علاقمند به استفاده با اس ی اس اس هستند این منوال کمک خوبی میکند به سوالات خود جواب دهیم بالاخص در زمینه کلاسه بندی اس ی اس اس

به آدرس زیر برای دریافت فایل مراجعه کنید

آموزش شبکه عصبی با اس پی اس اس 17

+ نوشته شده در  جمعه بیست و هفتم فروردین 1389ساعت 12:44 PM  توسط علیرضا پاک گوهر  | 

آزمون نرمال بودن در حالت چند متغیره

 

بسیاری از کسانی که با داده هایی سرو کار دارند که در نهایت می خواهند از آنها مدلهای مبتنی بر پذیره نرمال بودن داده ها برازش داهند مانند مدلهای رگرسیونی خطی و...  یا آنکه آزمونهایی انجام دهند که نیازمند آن است که در درجه اول داده ها نرمال باشند. دوست خوبم آقای احسان صباغیان در این باره مطلب مفیدی در وبلاگ خود ارائه داده اند که برای نشر آن آدرس مطلب را در ادامه آورده ام:

 

http://ehsanbiostat.blogfa.com/post-51.aspx

خوبی توضیحات آقای صباغیان ارائه منابع اطلاعات است.

+ نوشته شده در  جمعه هشتم آبان 1388ساعت 12:58 PM  توسط علیرضا پاک گوهر  | 

منابع داده StatLib---Datasets Archive

اگربخواهید کار آماری با یک سری داده بکنید پیشنهاد من سایت های داده ای زیر است:

http://lib.stat.cmu.edu/datasets/

برای جزییات بیشتر رجوع کنید به:

 


ادامه مطلب
+ نوشته شده در  جمعه یکم آبان 1388ساعت 1:1 PM  توسط علیرضا پاک گوهر  | 

شعار آمار

Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write.” H.G. Wells (1886-1946)
+ نوشته شده در  پنجشنبه شانزدهم مهر 1388ساعت 10:27 AM  توسط علیرضا پاک گوهر  | 

مطالب جدیدتر
مطالب قدیمی‌تر
 
<-PostTitle->