Quantcast
Channel: آمار برای امروز و فردای نزدیک
Viewing all 120 articles
Browse latest View live

ورود داده در نرم افزار R با استفاده از صفحه گسترده

$
0
0
با سلام

اگر چهارچوب داده یا ماتریس را در جلسه کاری خود دارید می توانید در یک محیط صفحه گسترده (همانند نرم افزار اکسل) آن را تصحیح نمایید.

برای این منظور چهارچوب داده همانند xold را می توانید با استفاده از دستور 

edit(xold)

در یک صفحه گسترده مشاهده نمود و در صورت نسبت داده این شی به شی جدید به نام xnew و تصحیح داده ها در صفحه گسترده چهارچوب داده (یا ماتریس) جدیدی را خواهید داشت که از اصلاح چهارچوب داده (یا ماتریس) قبلی و با استفاده از رابط کاربری بدست می آید.

برای درست نمودن چهار چوب داده جدید کافیست که همین را دستور را به صورت 

xnew<-edit(data.frame())

اجرا نمایید و در صفحه گسترده وارد شده اطلاعات خود را باز کنید.


رگرسیون سلسله مراتبی و کاربرد آن

$
0
0
در رگرسیون چندگانه سلسله مراتبی ، محقق ترتیبی را که متغیرهای پیشگو در قالب دو مجموعه  وارد مدل می شوند مشخص می کند. لذا با استفاده از این رویه می توان کیفیت مدل و اثر متغیری یا گروهی از متغیرها را بعد از  کنترل اثر متغیر(های) مرحله اول  بررسی نمود. 

محقق برای این متغیر(ها)،متغیرهای مرحله اول، مدل رگرسیونی چندگانه را اجرا می نماید( توجه: بنا به نیاز می توان رویه های گوناگون enter، stepwise،remove، backward  یا forward را انتخاب نمود).  از روی خروجی مربوطه برای این مدل ، مدل مرحله اول، می توان میزان تغییراتی که توجه آن توجیه شده  است را بدست آورد(منظور بررسی ضریب تعیین می باشد). محقق مدل مرحله دوم را با ترکیب متغیرهای اولیه به همراه مجموعه متغیرهای جدید اجرا می نماید و از بررسی نتایج این دو مرحله و مقایسه مقدار تغییرات توجیه شده به سوال زیر پاسخ می دهد:

آیا مدل رگرسیونی با کنترل اثر متغیر(های) خاصی، در سطح مجموعه ای از متغیرهای پیشگوی دیگر معتبر است؟ 


 در انتها می توان نکات زیر را برای این رویه بیان نمود:

1-رگرسیون چندگانه سلسله مراتبی به محقق این امکان را می دهد که ترتیب استفاده از فهرستی از متغیرهای پیشگو را مشخص نماید.

2-  این اقدام در نرم افزار SPSS با مشخص کردن دو مجموعه از متغیرها در دو بلوک به راحتی قابل انجام است.

3- در مرحله اول، می تواند تغییرات تنها یک متغیر کنترل گردد و لازم نیست حتما مجموعه ای از آنها را استفاده نمود.

4-رگرسیون چندگانه سلسله مراتبی برای محاسبه ضرایب مسیر در تحلیل مسیر ساده استفاده می شود.

5-این رویه به تحلیل چند سطحی (multi-level analysis) نیز نامیده میشود.


شما می توانید حال این سوال را بررسی نمایید: مقایسه بین رگرسیون گام به گام و این رویه چه نتیجه ای را در بر دارد؟

درگذشت شادروان جناب آقای دکتر غلامحسين شاهکار

گزارش رشد اقتصادی مرکز آمار ایران

$
0
0
با سلام

به تازگی مرکز آمار ایران رشد اقتصادی کشور را از سال 71 الی 91 (دوره بیست ساله) گزارش نموده است. و در این گزارش رشد اقتصادی ایران در سال 91 منفی مشاهده می گردد. برای مشاهده روند رشد اقتصادی بیست ساله بر روی لینک زیر کلیک کنید.


لینک به درگاه ملی آمار و مشاهده گزارش

چولگی ، کشیدگی و منحنی نرمال

$
0
0
چولگی

در هر کلامی، عبارت های “skewed” و “askew” ( به ترتیب اریب و کج شده ) برای ارجاع به موردی استفاده می گردد که خارج از خط  را نشان می دهد  یا در یک طرف تمایل دارد.  وقتی به شکل توزیع فراوانی یا توزیع احتمال اشاره می گردد، چولگی( “skewness”) به عدم تقارن توزیع ارجاع می کند.  یک توزیع با عدم تقارن دمی که در سمت را ست گسترش داده شده، به چولگی مثبت یا چوله به راست معروف می باشد در حالی که یک نوزیع با عدم تقارن دمی که در سمت چپ گسترش داده شده، به چولگی متفی یا چوله به چپ معروف می باشد. چولگی می تواند از منفی بینهایت تا مثبت بی نهایت مقدار بپذیرد.

اولین بار کارل پیرسون(1895)  اندازه گیری چولگی را بوسیله ی استاندارد نمودن تفاوت بین میانگین و مد یعنی 

انحراف استاندارد/(تفاضل میانگین از مد)

را   پیشنهاد نمود. مد جامعه به خوبی توجه مد نمونه ای برآورد نمی شود، اما می توان تفاوت بین میانگین و مد را با استفاده از سه برابر تفاضل بین میانگین از میانه برآورد نمود (استوارت و ارد، 1994) که منجر به تخمین چولگی زیر می گردد:

انحراف استاندارد/(تفاضل میانگین از میانه)3

این آماره از منفی یک الی مثبت یک تغییر می کند. مقدار قدرمطلق بیش از 0.2 چولگی زیاد را نشان می دهد (هیل دبراند، 1986).

چولگی همچنین نسبت به گشتاورسوم  حول میانگین تعریف می گردد، که همان مقدار مورد انتظار امتیازات Z مکعب شده می باشد. چولگی که به این طریق اندازه گیری می کردد گاهی به چولگی فیشر شناخته می شود. زمانی که انحرافات از میانگین در یک طرف آن نسبت به طرف دیگر بزرگتر باشد، این آماره از صفر و در جهت انحرافات بزرگتر تمایل پیدا می کند. لازم به توضیح است که برای داده های نمونه ای و در اغلب موارد این آماره توسط g1  برآورد می گردد که در آن مجموع مکعبات امتیاز Z توسط ضریب زیر نرمال سازی می گردد:

n/{(n-1)(n-2)}

برای اندازه های بزرگ (n>150)، آماره  g1  تقریبا دارای توزیع نرمال با حطای استاندارد تقریبی جذر n/6 می باشد. گرونولد و میدن(1984) آماره ای را نسبت به آماره فوق معرفی نموده اند که در مواردی بهتر عمل می کند؛ بدین معنا که آماره فوق در مواردی دارای نتایج عجیبی می باشد و درحالی که توزیع چوله به راست می باشد، چولگی را منفی محاسبه می نماید.

برای محققین علوم رفتای توجه به چولگی دارای اهمیت می باشد زمانی که در داده ها چنین موردی رخ می دهد. چولگی بزرگ  محقق را برای کنکاش داده های پرت رهنمود می کند. توزیع نرمال دارای چولگی صفر می باشد. اگرچه، یک توزیع می توان کاملا متقارن باشد از از شکل توزیع نرمال بسیار متفاوت باشد. به طور معمول تبدیلاتی برای کاهش چولگی (مثبت) شامل ریشه دوم، لگاریتم و تبدیل معکوس استفاده می کردد.

کشیدگی

در سال 1905 کارل پیرسون درجه چولگی توزیع را بوسیله beta2-3 تعریف نمود که در آن beta2 مقدار مورد انتظار توزیغ امتیازات Z می باشد که این امتیازات به توان چهارم می باشند. beta2 اغلب به کشیدگی پیرسون و 

  beta2-3 به عنوان فزونی کشیدگی یا کشیدگی فیشر  شناخته می شود. برآوردگر نااریب beta2-3  را با g2  نمایش می دهیم و به صورت A*C-B تعریف می شود که ضریب A  برابر

n(n+1)/{(n-1)(n-2)(n-3)}

و مقدار ثابت B برابر 

3(n-1)2/{(n-2)(n-3)}

می باشد. و عبارت C  مجموع توان چهارم امتیازات Z می باشد. برای نمونه های بزرگ (n>1000)، آماره  g2 تقریبا دارای توزیع نرمال با انحراف استاندارد جذر عبارت 24 تقسیم بر n  می باشد(اسندکور و کوکران، 1967). 

پیرسون در سال 1905 کشیدگی را به عنوان اندازه ای از میزان همواری بالای یک توزیع متقارن ارائه نمود تا آن را با توزیع نرمال با واریانس مشابه مقایسه نماید. پیرسون به توزیع های همواار تر بالای توزیع با مقدار کشیدگی منفی، پهن (“platykurtic”) به توزیع های با همواری کمتر در بالای توزیع با مقدار کشیدگی مثبت، کشیده (“leptokurtic”) نامید. دکارلو(1967) اذعان نمود که مقدار کشیدگی بیشتر از امتیازات دمی تاثیر می پذیرد تا امتیاز نزدیک به مرکز توزیع. بر این اساس، اغلب اوقات مناسب است توزیع های کشیده را دم کلفت و توزیع پهن را دم نازک می نامیم.

آشفتگی زیادی درباره مفهوم کشیدگی در خصوص شکل توزیع وجود دارد. اغلب نویسندگان در کتابها کشیدگی را به عنوان اندازه تیزی توزیع ها اظهار می کند که به طور اکید صحیح نمی باشد.

مدل بندی رگرسیون (نگرش کلی)

$
0
0

مدل بندی یا به طور دقیق مدل سازی آماری پیشینه دیرینه و غنی  دارد و در حال حاضر به طور جدایی ناپذیری با علم به پیش می رود. در یک طبقه بندی ساده می توان آن را به مدل بندی خطی و غیر خطی تقسیم بندی نمود و در نگرش دیگر بر اساس ماهیت متغیر می توان مدل بندی لجستیک، پواسن را مد نظر قرار داد. در حال حاضر کلی ترین تکنیک مدل بندی آماری، مدل بندی خطی تعمیم یافته (GLM)  می باشد در ساده ترین حالت خود مدلبندی رگرسیونی را در بر می گیرد.

مدل بندی رگسیونی در واقع به مدل در آوردن روابط حاکم بین ویژگی ها(متغیرها) ی موجود می باشد که به تقریب مناسب آن برای روابط واقعی اعتقاد تجربی یا تئوری داریم. مدل بندی رگرسیونی نیز به نوبه خود به مدل بندی رگرسیونی خطی و غیر خطی تقسیم بندی میشود که برای ادامه بحث مدل رگرسیون خطی بررسی می شود.

اگر در مدل رگسیونی تنها یک متغیر وابسته که به دنبال بررسی رفتار آن یا به طور دقیق پیشگویی مقادیر آینده آن هستیم دو حالت  و دسته بندی وجود دارد: 1- تنها یک متغیر مستقل داریم که مدل، به مدل رگسیونی خطی ساده نامیده می شود 2- بیش از یک متغیر مستقل داریم که مدل، به مدل رگسیونی چندگانه معروف است و در حالیکه بیش از یک متغیر وابسته داریم مدل، مدل رگسیونی چند متغیره خواهد بود.

با این مقدمه در ادامه به دنبال بررسی تغییرات موجود در یک متغیر(وابسته) هستیم. یعنی قصد داریم علاوه بر مدل بندی تغییرات موجود برای این متغیر، مقدار آینده آن را پیشگویی کنیم. برای این منظور تعداد از متغیرهای مستقل را جهت این دو منظور می بایست کاندید نماییم که البته آنها می بایست رابطه قوی با متغیر وابسته داشته باشند. در تحلیل آماری مدل های رگسیونی با افزایش تعداد متغیرها معایبی را داریم که از جمله آنها می توان به پیچیده شدن مدل رگسیونی و نیز احتمال وجود همخطی چندگانه اشاره نمود.

مزید اطلاع است که با افزایش تعداد متغیرهای مستقل موثر، مدل قوی تر خواهد بود با این مناسب به اصل امساک در استفاده از متغیرهای مستقل واقف بود.

با این مقدمه سوال این است که چگونه این موارد را رعایت نماییم و توافقی را بین مدل مناسب و ساده تر بر قرار نماییم. برای چنین منظوری رویه زیر در تحلیل و بررسی معمول است:

با استفاده از تجربیات و تئوری ها و همچنین تحقیقات موجود متغیرهای مستقل را مشخص می نماییم و در انتها با وارد نمودن ملاک های صلاحیت حضور متغیرهای مستقل، تعداد آنها را کاهش می دهیم.

به عنوان مثال اگر دو متغیر مستقل رابطه قوی دارند کافیست یکی از آنها را در مدل وارد نماییم چرا که دانش و مشاهده تنها یکی از آنها می تواند در پیشگویی متغیر وابسته مثمر ثمر باشد.

مفهموم آزمون استقلال در جداول توافقی و انجام آن در SPSS

$
0
0
در ابتدا تعریف جدول توافقی و در ادامه آزمون استقلال مبتنی بر آزمون خی دو را شرح می دهیم:

جدول فراوانی توام حداقل دو متغیر کیفی که نشان دهنده ی وابستگی دو متغیر می باشد، جدول توافقی نامیده می شود. ما با آزمون استقلال به دنبال بررسی استقلال یا وابستگی متغیرهای کیفی در سطر و ستون ها هستیم. این آزمون به آزمون خی دو یا کای دو معروف می باشد. آماره آزمون با تکیه بر فراوانی های مشاهده شده و فراوانی ها مورد انتظار تشکیل می گردد. این آزمون همانند اکثر آزمون های آماری نیاز به پیش فرض هایی دارد که یکی از آنها اینست که فراوانی مورد انتظار در هر خانه جدول کمتر از 5 نباشد. 


جهت مشاهده بحث کامل به ادامه مطلبمراجعه فرمایید.

آزمون کروسکال والیس و مراحل انجام در SPSS

$
0
0
همانطور که استفاده از تحلیل واریانس یک طرفه در بسیاری از موارد از جمله مقایسات چند گانه راهگشا تصمیم و تحلیل می باشد در مواردی نیز به دلیل حجم کم نمونه ها و عدم توانایی در بررسی پذیره های مربوط به آنالیر واریانس یک طرفه یا نوع مقیاس اندازه گیری داده ها (رتبه ای) می بایست از معادل نا پارامتری آن یعنی آزمون کروسکال والیس استفاده نمود: در فایل زیر که گردآوردنده آن یکی از دانشجویان می باشد مقدمه مفید و نحوه انجام کار آن در SPSS ارائه شده است:

لینک های دانلود:

PDF:  لینک 1                لینک 2

Word:  لینک1                 لینک 2 

(دانشجو:س. توحیدی)



تحلیل t دو نمونه ای مستقل و تحلیل همبستگی

$
0
0
در فایل زیر که نتیجه یک کار دانشجویی می باشد که پس از ارائه آماره های توصیفی مناسب،  دو گروه (زن و مرد) به عنوان دو نمونه مستقل با استفاده از آزمون t دو نمونه ای مستقل مقایسه نمود و در آن  نتیجه آزمون لونه و t بررسی می گردد. در انتها نیز با استفاده از تحلیل همبستگی و رگرسیون خطی ساده رابطه بین فشار خون و وزن بررسی می گردد. در این تحلیل ضریب تبیین ، نمودار پراکنش و نمودا احتمال تجمعی جهت بررسی نرمال بودن نیز مورد توجه قرار گرغته است:

لینک ها دانلود:

PDF: لینک1             لینک 2

WORD: لینک1            لینک 2  




(تهیه کننده: ف. زنگی آبادی)

راهنمای نرم افزار R در آمار توصیفی

$
0
0

در این قسمت رسم نمودارها در R  و نحوه محاسبه  میانگین و واریانس در R  به طور مختصر بیان شده  است. برای مشاهده این پروژه آماری به لینک زیر مراجعه فرمائید

 

نگاه مختصری بر امار توصیفی

راهنمای نرم افزار R در ماتریس

$
0
0

در فایل زیر به تعریف  ماتریس و نحوه وارد کردن داده ها به صورت ماتریسی و فراخوانی درایه ها و محاسبه با ماتریس ها و ترکیب ماتریس ها با هم در نرم افزار R پرداخته شده است. برای مشاهده فایل به لینک زیر مراجعه فرمائید.

مشاهده فایل 

مراحل اصلی در نمونه گیری

$
0
0

 

1-هدف بررسی

با مشخص کردن هدف تحقیق و  دانستن اینکه از داده ها،امید فراگیری چه چیز را داریم به راحتی می توانیم روش نمونه گیری را تعیین کنیم.

 

2- جامعه مورد بررسی

یک جامعه آماری،عبارت است از مجموعی ای از افراد یا واحد ها که دارای حداقل یک صفت مشترک باشند. معمولا در پزوهش،جامعه مورد بررسی یک جامعه آماری است که پژوهشگر مایل است درباره ی صفت(صفت ها)متغیر واحد های ان به مطالعه بپردازد.


بهادامه مطلبمراجعه فرمائید

آزمون آنالیز واریانس

$
0
0

مواقعی که پژوهشگری بخواهد بیش از دو نمونه را مقایسه کند،باید از انالیز واریانس استفاده کند.انالیز واریانس یک روش فراگیر تر ازTاست و برخی پژوهشگران حتی وقتی مقایسه میانگین های دو نمونه مورد نظر است،از این روش استفاده می کنند.

طرح های متنوعی برای انالیز واریانس وجود دارد و هر یک از انالیز آماری خاص خودش را طلب می کند. از جمله این طرح ها می توان به انالیز یک عاملی واریانس(انالیز واریانس یک طرفه)اشاره نمود.

ترسیم توزیع کای دو در R (دو روش)

$
0
0
برای ترسیم یک سری داده های شبیه سازی شده از توزیع کای دو (خی دو) جهت مقایسه یا نکوئی برازش می توان  هر یک از روشهای زیر استفاده نمود. توجه شود که کاربرد و استفاده این دو روش بنا به ماهیت مساله متفاوت بوده و شما در انتخاب آنها یا تلفیق آن مختار هستید.

شایان ذکر است که  توابع rchisq برای تولید عدد تصادفی از توزیع خی دو، hist برای ترسیم بافت نگار، seq برای تولید یک سری داده در بازه ای مشخص، lwd جهت تعیین پهنای منحنی های ترسیم شده استفاده می شود.


لطفا برای مشاهده متن کامل بهادامه مطلبتوجه فرمایید

ضریب همبستگی و انجام آن در SPSS

$
0
0

در پروژه زیر به تعریف همسبتگی پرداخته شده، سپس به تعریف ضریب همبستگی پیرسن و نحوه محاسبه این ضریب همبستگی در spssو تحلیل ان پرداخته شده و در پایان به تعریف ضریب همبستگی اسپیرمن و نحوه محاسبه این ضریب در spssپرداخته شده است.  شما به صورت رایگان می توانید به دانلود یا مطالعه اقدام نمایید.

 

(دانشجو: ر، مرادی)

pdf:

مشاهده لینک

word:

مشاهده لینک


آزمون فریدمن و انجام آن در SPSS

$
0
0

در لینک زیر در قالب یک پروژه آماری به تعریف  آزمونفریدمنو نحوهمحاسبهاینآزموندر نرم افزار spssو چگونگی تفسیراین آزمون پرداخته شده است.  شما به صورت رایگان می توانید به دانلود یا مطالعه اقدام نمایید.

 

(دانشجو:ز.بیرانوند)

pdf:

مشاهده لینک 

word:

مشاهده لینک


آزمون T و انجام آن در spss

$
0
0

 در این تحلیل آماری می خواهیم رابطه بین متغیرهای سن،جنس،ساعت کار ،وضعیت زندگی ومیزان تحصیلات افراد بر میزان درآمد را بررسی کنیم.افراد آزمودنی از چهار مقطع تحصیلی(دیپلم،لیسانس،فوق لیسانس،دکتری)هستند.تعداد کل آزمودنی ها 30 نفر می باشد.(16مرد،14زن)افراد آزمودنی دارای محدوده سنی خاصی نیستند.هر کدام از این متغیرها را به طور جداگانه بررسی می کنیم تا اینکه مشخص شود کدام یک بر میزان درآمد تاثیر دارد و تاثیر کدام یک بیشتر است. برای بررسی متغیرها ابتدا جدول فراوانی و سپس نمودار هریک را به طور جداگانه رسم ونمودار پراکنش را برای بررسی رابطه بین سن و میزان درامد رسم میکنیم. برای بررسی متغیرها از نمودار شاخه و برگ نیز استفاده شده است. در پایان برای بررسی رابطه بین متغیرها از آزمون Tوجدول  Anova استفاده می کنیم. 

(دانشجو:ح ،صحراگرد)

 pdf:

مشاهده فایل

word:

مشاهده فایل


آزمون فرض در spss

$
0
0

در فایل زیر با محاسبه آزمون فرض و  رسم جدول فراوانی و نمودار و آزمون Tدر spssبه  بررسي ميزان اضطراب در دختران و پسران پرداخته شده است.

(دانشجو: ف،سوری)

pdf:

مشاهده فایل

word:

مشاهده فایل

آزمون دونمونه ای زوجی

$
0
0

 در فایل زیر داده های مربوط به سال‌های 2009، 2010، 2011 را انتخاب و فرضیه ... را مورد بررسی قرار داده . برای این منظور و مطالعه جنبه های جسمانی ازآزمون های آماری T دونمونه ای (مستقل و وابسته) و Tیک نمونه ای استفاده شده است. مشاهده شد که بین گروه های سنی 24-20سال و 28-24 سال تفاوت معنی داری وجود دارد.

(دانشجو:س،رحمتی)

pdf:

https://docs.google.com/file/d/0B1aFPwDfe4SWblpwNVVwanVycGs/edit

word:

https://docs.google.com/file/d/0B1aFPwDfe4SWd3NuUzZxSFRaNlE/edit

آزمون های تعقیبی-آزمون شفه

$
0
0

آزمون شفه

چون ما اغلب نیاز به بررسی های مقابله ای داریم که شامل ترکیب های مختلف تیمارند،به همین خاطر از آزمون شفه استفاده می کنیم چون تمام آزمون های معمول به مقایسه جفت میانگین ها می پردازد .

در آزمون شفه فرض صفر بودن مقابله ها آزمون می شود. در واقع می توان هر مقابله ای را از نظر معنی دار بودن ان آزمون کرد.آزمون شفه برای مجموعه های بزرگتری از مقابله های ممکن معتبر است.

برای استفاده از آزمون شفه باید بعد از جمع اوری داده ها مراحل زیر را انجام داد:

1-در نظر گرفتن تمام مقابله های مورد توجه و محاسبه مقدار عددی آنها

2-تعیین معنی دار بودن آماره Fحاصل از جدول تحلیل واریانس

3-محاسبه مجموعه مربعات هر مقابله،مثلا مقابله بر اساس دستور...... 

 برای دانلودمتن کامل به لینک زیر مراجعه نمایید.

 دانلود

Viewing all 120 articles
Browse latest View live