ورود داده در نرم افزار R با استفاده از صفحه گسترده

June 29, 2013, 11:06 am

≫ Next: رگرسیون سلسله مراتبی و کاربرد آن

≪ Previous: GLM چند متغیره، MANOVA و MANCOVA

با سلام

اگر چهارچوب داده یا ماتریس را در جلسه کاری خود دارید می توانید در یک محیط صفحه گسترده (همانند نرم افزار اکسل) آن را تصحیح نمایید.

برای این منظور چهارچوب داده همانند xold را می توانید با استفاده از دستور

edit(xold)

در یک صفحه گسترده مشاهده نمود و در صورت نسبت داده این شی به شی جدید به نام xnew و تصحیح داده ها در صفحه گسترده چهارچوب داده (یا ماتریس) جدیدی را خواهید داشت که از اصلاح چهارچوب داده (یا ماتریس) قبلی و با استفاده از رابط کاربری بدست می آید.

برای درست نمودن چهار چوب داده جدید کافیست که همین را دستور را به صورت

xnew<-edit(data.frame())

اجرا نمایید و در صفحه گسترده وارد شده اطلاعات خود را باز کنید.

↧

رگرسیون سلسله مراتبی و کاربرد آن

July 11, 2013, 7:25 am

≫ Next: درگذشت شادروان جناب آقای دکتر غلامحسين شاهکار

≪ Previous: ورود داده در نرم افزار R با استفاده از صفحه گسترده

در رگرسیون چندگانه سلسله مراتبی ، محقق ترتیبی را که متغیرهای پیشگو در قالب دو مجموعه وارد مدل می شوند مشخص می کند. لذا با استفاده از این رویه می توان کیفیت مدل و اثر متغیری یا گروهی از متغیرها را بعد از کنترل اثر متغیر(های) مرحله اول بررسی نمود.

محقق برای این متغیر(ها)،متغیرهای مرحله اول، مدل رگرسیونی چندگانه را اجرا می نماید( توجه: بنا به نیاز می توان رویه های گوناگون enter، stepwise،remove، backward یا forward را انتخاب نمود). از روی خروجی مربوطه برای این مدل ، مدل مرحله اول، می توان میزان تغییراتی که توجه آن توجیه شده است را بدست آورد(منظور بررسی ضریب تعیین می باشد). محقق مدل مرحله دوم را با ترکیب متغیرهای اولیه به همراه مجموعه متغیرهای جدید اجرا می نماید و از بررسی نتایج این دو مرحله و مقایسه مقدار تغییرات توجیه شده به سوال زیر پاسخ می دهد:

آیا مدل رگرسیونی با کنترل اثر متغیر(های) خاصی، در سطح مجموعه ای از متغیرهای پیشگوی دیگر معتبر است؟

در انتها می توان نکات زیر را برای این رویه بیان نمود:

1-رگرسیون چندگانه سلسله مراتبی به محقق این امکان را می دهد که ترتیب استفاده از فهرستی از متغیرهای پیشگو را مشخص نماید.

2- این اقدام در نرم افزار SPSS با مشخص کردن دو مجموعه از متغیرها در دو بلوک به راحتی قابل انجام است.

3- در مرحله اول، می تواند تغییرات تنها یک متغیر کنترل گردد و لازم نیست حتما مجموعه ای از آنها را استفاده نمود.

4-رگرسیون چندگانه سلسله مراتبی برای محاسبه ضرایب مسیر در تحلیل مسیر ساده استفاده می شود.

5-این رویه به تحلیل چند سطحی (multi-level analysis) نیز نامیده میشود.

شما می توانید حال این سوال را بررسی نمایید: مقایسه بین رگرسیون گام به گام و این رویه چه نتیجه ای را در بر دارد؟

↧

درگذشت شادروان جناب آقای دکتر غلامحسين شاهکار

September 12, 2013, 3:00 pm

≫ Next: گزارش رشد اقتصادی مرکز آمار ایران

≪ Previous: رگرسیون سلسله مراتبی و کاربرد آن

با سلام

با نهایت تاثر و تاسف و نیز ضمن عرض تسلیت جهت مشاهده اصل خبر به لینک زیر مراجعه فرمایید

خبر درگذشت استاد والاقدر جناب آقای دکتر شاهکار در انجمن آمار

↧

گزارش رشد اقتصادی مرکز آمار ایران

September 16, 2013, 12:35 am

≫ Next: چولگی ، کشیدگی و منحنی نرمال

≪ Previous: درگذشت شادروان جناب آقای دکتر غلامحسين شاهکار

با سلام

به تازگی مرکز آمار ایران رشد اقتصادی کشور را از سال 71 الی 91 (دوره بیست ساله) گزارش نموده است. و در این گزارش رشد اقتصادی ایران در سال 91 منفی مشاهده می گردد. برای مشاهده روند رشد اقتصادی بیست ساله بر روی لینک زیر کلیک کنید.

لینک به درگاه ملی آمار و مشاهده گزارش

↧

چولگی ، کشیدگی و منحنی نرمال

January 13, 2014, 9:45 am

≫ Next: مدل بندی رگرسیون (نگرش کلی)

≪ Previous: گزارش رشد اقتصادی مرکز آمار ایران

چولگی

در هر کلامی، عبارت های “skewed” و “askew” ( به ترتیب اریب و کج شده ) برای ارجاع به موردی استفاده می گردد که خارج از خط را نشان می دهد یا در یک طرف تمایل دارد. وقتی به شکل توزیع فراوانی یا توزیع احتمال اشاره می گردد، چولگی( “skewness”) به عدم تقارن توزیع ارجاع می کند. یک توزیع با عدم تقارن دمی که در سمت را ست گسترش داده شده، به چولگی مثبت یا چوله به راست معروف می باشد در حالی که یک نوزیع با عدم تقارن دمی که در سمت چپ گسترش داده شده، به چولگی متفی یا چوله به چپ معروف می باشد. چولگی می تواند از منفی بینهایت تا مثبت بی نهایت مقدار بپذیرد.

اولین بار کارل پیرسون(1895) اندازه گیری چولگی را بوسیله ی استاندارد نمودن تفاوت بین میانگین و مد یعنی

انحراف استاندارد/(تفاضل میانگین از مد)

را پیشنهاد نمود. مد جامعه به خوبی توجه مد نمونه ای برآورد نمی شود، اما می توان تفاوت بین میانگین و مد را با استفاده از سه برابر تفاضل بین میانگین از میانه برآورد نمود (استوارت و ارد، 1994) که منجر به تخمین چولگی زیر می گردد:

انحراف استاندارد/(تفاضل میانگین از میانه)3

این آماره از منفی یک الی مثبت یک تغییر می کند. مقدار قدرمطلق بیش از 0.2 چولگی زیاد را نشان می دهد (هیل دبراند، 1986).

چولگی همچنین نسبت به گشتاورسوم حول میانگین تعریف می گردد، که همان مقدار مورد انتظار امتیازات Z مکعب شده می باشد. چولگی که به این طریق اندازه گیری می کردد گاهی به چولگی فیشر شناخته می شود. زمانی که انحرافات از میانگین در یک طرف آن نسبت به طرف دیگر بزرگتر باشد، این آماره از صفر و در جهت انحرافات بزرگتر تمایل پیدا می کند. لازم به توضیح است که برای داده های نمونه ای و در اغلب موارد این آماره توسط g₁برآورد می گردد که در آن مجموع مکعبات امتیاز Z توسط ضریب زیر نرمال سازی می گردد:

n/{(n-1)(n-2)}

برای اندازه های بزرگ (n>150)، آماره g₁تقریبا دارای توزیع نرمال با حطای استاندارد تقریبی جذر n/6 می باشد. گرونولد و میدن(1984) آماره ای را نسبت به آماره فوق معرفی نموده اند که در مواردی بهتر عمل می کند؛ بدین معنا که آماره فوق در مواردی دارای نتایج عجیبی می باشد و درحالی که توزیع چوله به راست می باشد، چولگی را منفی محاسبه می نماید.

برای محققین علوم رفتای توجه به چولگی دارای اهمیت می باشد زمانی که در داده ها چنین موردی رخ می دهد. چولگی بزرگ محقق را برای کنکاش داده های پرت رهنمود می کند. توزیع نرمال دارای چولگی صفر می باشد. اگرچه، یک توزیع می توان کاملا متقارن باشد از از شکل توزیع نرمال بسیار متفاوت باشد. به طور معمول تبدیلاتی برای کاهش چولگی (مثبت) شامل ریشه دوم، لگاریتم و تبدیل معکوس استفاده می کردد.

کشیدگی

در سال 1905 کارل پیرسون درجه چولگی توزیع را بوسیله beta₂-3 تعریف نمود که در آن beta₂مقدار مورد انتظار توزیغ امتیازات Z می باشد که این امتیازات به توان چهارم می باشند. beta₂ اغلب به کشیدگی پیرسون و

beta₂-3 به عنوان فزونی کشیدگی یا کشیدگی فیشر شناخته می شود. برآوردگر نااریب beta₂-3 را با g₂نمایش می دهیم و به صورت A*C-B تعریف می شود که ضریب A برابر

n(n+1)/{(n-1)(n-2)(n-3)}

و مقدار ثابت B برابر

3(n-1)²/{(n-2)(n-3)}

می باشد. و عبارت C مجموع توان چهارم امتیازات Z می باشد. برای نمونه های بزرگ (n>1000)، آماره g₂تقریبا دارای توزیع نرمال با انحراف استاندارد جذر عبارت 24 تقسیم بر n می باشد(اسندکور و کوکران، 1967).

پیرسون در سال 1905 کشیدگی را به عنوان اندازه ای از میزان همواری بالای یک توزیع متقارن ارائه نمود تا آن را با توزیع نرمال با واریانس مشابه مقایسه نماید. پیرسون به توزیع های همواار تر بالای توزیع با مقدار کشیدگی منفی، پهن (“platykurtic”) به توزیع های با همواری کمتر در بالای توزیع با مقدار کشیدگی مثبت، کشیده (“leptokurtic”) نامید. دکارلو(1967) اذعان نمود که مقدار کشیدگی بیشتر از امتیازات دمی تاثیر می پذیرد تا امتیاز نزدیک به مرکز توزیع. بر این اساس، اغلب اوقات مناسب است توزیع های کشیده را دم کلفت و توزیع پهن را دم نازک می نامیم.

آشفتگی زیادی درباره مفهوم کشیدگی در خصوص شکل توزیع وجود دارد. اغلب نویسندگان در کتابها کشیدگی را به عنوان اندازه تیزی توزیع ها اظهار می کند که به طور اکید صحیح نمی باشد.

↧

مدل بندی رگرسیون (نگرش کلی)

January 19, 2014, 11:40 am

≫ Next: مفهموم آزمون استقلال در جداول توافقی و انجام آن در SPSS

≪ Previous: چولگی ، کشیدگی و منحنی نرمال

مدل بندی یا به طور دقیق مدل سازی آماری پیشینه دیرینه و غنی دارد و در حال حاضر به طور جدایی ناپذیری با علم به پیش می رود. در یک طبقه بندی ساده می توان آن را به مدل بندی خطی و غیر خطی تقسیم بندی نمود و در نگرش دیگر بر اساس ماهیت متغیر می توان مدل بندی لجستیک، پواسن را مد نظر قرار داد. در حال حاضر کلی ترین تکنیک مدل بندی آماری، مدل بندی خطی تعمیم یافته (GLM) می باشد در ساده ترین حالت خود مدلبندی رگرسیونی را در بر می گیرد.

مدل بندی رگسیونی در واقع به مدل در آوردن روابط حاکم بین ویژگی ها(متغیرها) ی موجود می باشد که به تقریب مناسب آن برای روابط واقعی اعتقاد تجربی یا تئوری داریم. مدل بندی رگرسیونی نیز به نوبه خود به مدل بندی رگرسیونی خطی و غیر خطی تقسیم بندی میشود که برای ادامه بحث مدل رگرسیون خطی بررسی می شود.

اگر در مدل رگسیونی تنها یک متغیر وابسته که به دنبال بررسی رفتار آن یا به طور دقیق پیشگویی مقادیر آینده آن هستیم دو حالت و دسته بندی وجود دارد: 1- تنها یک متغیر مستقل داریم که مدل، به مدل رگسیونی خطی ساده نامیده می شود 2- بیش از یک متغیر مستقل داریم که مدل، به مدل رگسیونی چندگانه معروف است و در حالیکه بیش از یک متغیر وابسته داریم مدل، مدل رگسیونی چند متغیره خواهد بود.

با این مقدمه در ادامه به دنبال بررسی تغییرات موجود در یک متغیر(وابسته) هستیم. یعنی قصد داریم علاوه بر مدل بندی تغییرات موجود برای این متغیر، مقدار آینده آن را پیشگویی کنیم. برای این منظور تعداد از متغیرهای مستقل را جهت این دو منظور می بایست کاندید نماییم که البته آنها می بایست رابطه قوی با متغیر وابسته داشته باشند. در تحلیل آماری مدل های رگسیونی با افزایش تعداد متغیرها معایبی را داریم که از جمله آنها می توان به پیچیده شدن مدل رگسیونی و نیز احتمال وجود همخطی چندگانه اشاره نمود.

مزید اطلاع است که با افزایش تعداد متغیرهای مستقل موثر، مدل قوی تر خواهد بود با این مناسب به اصل امساک در استفاده از متغیرهای مستقل واقف بود.

با این مقدمه سوال این است که چگونه این موارد را رعایت نماییم و توافقی را بین مدل مناسب و ساده تر بر قرار نماییم. برای چنین منظوری رویه زیر در تحلیل و بررسی معمول است:

با استفاده از تجربیات و تئوری ها و همچنین تحقیقات موجود متغیرهای مستقل را مشخص می نماییم و در انتها با وارد نمودن ملاک های صلاحیت حضور متغیرهای مستقل، تعداد آنها را کاهش می دهیم.

به عنوان مثال اگر دو متغیر مستقل رابطه قوی دارند کافیست یکی از آنها را در مدل وارد نماییم چرا که دانش و مشاهده تنها یکی از آنها می تواند در پیشگویی متغیر وابسته مثمر ثمر باشد.

April 13, 2014, 6:03 am

≫ Next: راهنمای نرم افزار R در ماتریس

≪ Previous: تحلیل t دو نمونه ای مستقل و تحلیل همبستگی

در این قسمت رسم نمودارها در R و نحوه محاسبه میانگین و واریانس در R به طور مختصر بیان شده است. برای مشاهده این پروژه آماری به لینک زیر مراجعه فرمائید

نگاه مختصری بر امار توصیفی

↧

راهنمای نرم افزار R در ماتریس

April 16, 2014, 4:55 am

≫ Next: مراحل اصلی در نمونه گیری

≪ Previous: راهنمای نرم افزار R در آمار توصیفی

در فایل زیر به تعریف ماتریس و نحوه وارد کردن داده ها به صورت ماتریسی و فراخوانی درایه ها و محاسبه با ماتریس ها و ترکیب ماتریس ها با هم در نرم افزار R پرداخته شده است. برای مشاهده فایل به لینک زیر مراجعه فرمائید.

مشاهده فایل

↧

مراحل اصلی در نمونه گیری

April 23, 2014, 7:16 am

≫ Next: آزمون آنالیز واریانس

≪ Previous: راهنمای نرم افزار R در ماتریس

1-هدف بررسی

با مشخص کردن هدف تحقیق و دانستن اینکه از داده ها،امید فراگیری چه چیز را داریم به راحتی می توانیم روش نمونه گیری را تعیین کنیم.

2- جامعه مورد بررسی

یک جامعه آماری،عبارت است از مجموعی ای از افراد یا واحد ها که دارای حداقل یک صفت مشترک باشند. معمولا در پزوهش،جامعه مورد بررسی یک جامعه آماری است که پژوهشگر مایل است درباره ی صفت(صفت ها)متغیر واحد های ان به مطالعه بپردازد.

بهادامه مطلبمراجعه فرمائید

↧

آزمون آنالیز واریانس

April 23, 2014, 7:21 am

≫ Next: ترسیم توزیع کای دو در R (دو روش)

≪ Previous: مراحل اصلی در نمونه گیری

مواقعی که پژوهشگری بخواهد بیش از دو نمونه را مقایسه کند،باید از انالیز واریانس استفاده کند.انالیز واریانس یک روش فراگیر تر ازTاست و برخی پژوهشگران حتی وقتی مقایسه میانگین های دو نمونه مورد نظر است،از این روش استفاده می کنند.

May 22, 2014, 1:54 am

≫ Next: آزمون LSD

≪ Previous: آزمون دونمونه ای زوجی

آزمون شفه

چون ما اغلب نیاز به بررسی های مقابله ای داریم که شامل ترکیب های مختلف تیمارند،به همین خاطر از آزمون شفه استفاده می کنیم چون تمام آزمون های معمول به مقایسه جفت میانگین ها می پردازد .

در آزمون شفه فرض صفر بودن مقابله ها آزمون می شود. در واقع می توان هر مقابله ای را از نظر معنی دار بودن ان آزمون کرد.آزمون شفه برای مجموعه های بزرگتری از مقابله های ممکن معتبر است.

برای استفاده از آزمون شفه باید بعد از جمع اوری داده ها مراحل زیر را انجام داد:

1-در نظر گرفتن تمام مقابله های مورد توجه و محاسبه مقدار عددی آنها

2-تعیین معنی دار بودن آماره Fحاصل از جدول تحلیل واریانس

3-محاسبه مجموعه مربعات هر مقابله،مثلا مقابله بر اساس دستور......

برای دانلودمتن کامل به لینک زیر مراجعه نمایید.