آزمون LSD
مفاهیم سری زمانی
تعریف سری زمانی:
دنباله ای از مشاهدات که بر حسب زمان مرتب شده اند.
سری زمانی به دو صورت بررسی میشود:
راهنمای حل مسایل در نرم افزار R
| 4 | 3 | 2 | 1 | x |
| 1/8 | 1/8 | 1/2 | 1/4 | p(x) |
در ادامه مطلب با ذکر مثال به سوال پاسخ داده شده :
برنامه نویسی R
در این پست میخواهیم تابع رگرسیون xبرyرا با برنامه R برازش دهیم با توجه به تابع چگالی زیر
X | 1 2 3 4 5 6 |
Y | 4 3 4 6 7 5 |
نظرسنجی اینترنتی زیر ذره بین علم آمار
در پاسخ باید گفت که جامعه آماری برای انجام نظرسنجی های اینترنتی متفاوت است، معمولاً افراد تشکیل دهنده جامعه آماری برای طرح های نظرسنجی گوناگون از لحاظ متغیرهای جمعیت شناختی دارای پراکندگی های زیادی هستند. به طور مثال در نظرسنجی های مربوط به انتخابات ریاست جمهوری، جامعه آماری شامل تمامی افراد بالای 18 سال سراسر کشور می باشد که در تمامی روستاها و شهرهای کشور پراکنده هستند. گردآوری نمونه معرف، زماني امكان پذير است كه نمونه های انتخابی كليه صفات و ويژگي هاي جامعه آماري مورد نظر را دارا باشند و بتوان آنها را نماینده کل جامعه به حساب آورد. یعنی نمونهای می تواند قابلیت تعمیم داشته باشد که دو ویژگی ذیل را دربر گیرد:
1-روايي نمونه آماري:
روايي نمونه آماري به این معنی است كه بتوان نمونه مورد مطالعه را از نظر همگوني با جامعه مورد مطالعه و دارا بودن ويژگي ها و صفات آن، بخشي از جامعه آماري تلقي کرد تا بتواند قابلیت تعمیم داشته باشد. همچنین در روش های نمونه گیری احتمالی تمام واحدهای جامعه بایستی شانس یکسانی برای حضور در نمونه نهایی را داشته باشند. در نظر سنجی های اینترنتی نمونه بدست آمده تنها بخش خاصی از جامعه را پوشش می دهد (تنها افرادی که برای آنها امکان دسترسی به اینترنت وجود دارد) و قسمت عمده ای از جامعه آماری شانس حضور در نظرسنجی را ندارند . آیا زیرساخت الکترونیکی لازم برای یک فرد روستایی در دورترین نقاط این مرز و بوم برای مراجعه به سایت های مورد نظر وجود دارد تا نظر خودش را انعکاس دهد؟ آیا افراد مسن به سایت های اینترنتی دسترسی دارند و یا در صورت دسترسی، علاقه ای به سایت های برگزار کننده نظرسنجی اینترنتی دارند؟ آیا اطلاع دارند که چه سایتهایی نظرسنجی اینترنتی را انجام می دهند؟
2- تناسب حجمي نمونه آماري:
تناسب حجمي نمونه مورد مطالعه زمانی رعایت می شود كه در نمونه گردآوری شده، اندازه كافي و مناسبی از افراد با در نظر گرفتن تمام متغیرهای جمعیت شناختی، حضور داشته باشند (جنسیت، سن، محل سکونت، وضعیت اشتغال، و ضعیت تحصیلات)، به طوري که از نظر كمي بتوان آن را نماینده جامعه آماري تلقي كرد و بتوان نتايج مطالعه را به جامعه تعميم داد. معمولاً در نظرسنجی های اینترنتی تعداد نمونه مکفی از تمام زیرگروه های جامعه آماری (بر حسب متغیرهای جمعیت شناختی) گردآوری نمی شود و افراد مراجعه کننده به سایت ها شامل گروه های خاصی هستند.
علاوه بر موارد فوق نکات دیگری نیز از منظر نمونه گیری حایز اهمیت است:
- در نظرسنجی های اینترتی امکان تکراری بودن واحد انتخابی از جامعه آماری وجود دارد. به عبارت دیگر یک فرد می تواند چندین مرتبه در نظرسنجی مذکور شرکت کند که این امر با اصل شانس برابر جهت انتخاب شدن تمام افراد جامعه آماری در تناقض است و سبب ایجاد سوگیری در نتایج می شود.
- در نطرسنجی های اینترنتی معمولاً اصل مستقل بودن نتایج حاصل از نمونه های آماری رعایت نمی گردد. افراد شرکت کننده در نظرسنجی های مذکور می توانند نظرات افراد قبلی شرکت کننده را ببینند که این باعث ایجاد اریب در نتایج نهایی می گردد. به عنوان مثال نسبت آراء مخاطبان چند میلیونی برنامه 90 در طول برنامه تغییر چندانی نمی کند( آهنگ نسبت ها و نمودار هر گزینه تقریبا تابع و شبیه آرای اولیه است).
با توجه به موارد ذکر شده در بالا، بدیهی است هر رسانه ای که بتواند بیشترین مخاطب (بر حسب متغیرهای جمعیت شناختی) را در برگیرد و نفرات بیشتری از گروه های مختلف جامعه در چنین نظرسنجی هایی شرکت کنند به تدریج می تواند ادعا کند که توانایی سنجش دقیق افکار عمومی (حداقل مخاطبان وب) را دارد.
معرفی ایسپا(مرکز افکار سنجی دانشجویان ایران)
مرکز افکارسنجی دانشجویان ایران (ایسپا) وابسته به جهاد دانشگاهیدر راستای توسعه علمی و تحقیقاتی کشور و با قصد رفع نیاز سازمانها و نهادهای تصمیم گیر ، ضرورت توجه به افکار عمومی و لزوم بهره گیری از مشارکت و دیدگاههای شهروندان در بهبود و توسعه امور کشور در عرصه های مختلف، از سال 1380 فعالیت خود را آغاز کرده است.
اصول بنیادین و اساسی ایسپا در طراحی و اجرای فعالیتهای پژوهشی و نظرسنجی، تاکید بر بکارگیری معیارهای دقیق علمی و فنی ، رعایت و حفظ موضع بی طرفی در قبال مسایل و موضوعات مورد بررسی ؛ استفاده از پشتوانه اعتماد مسئولان و مردم به نهاد ارزشی جهاد دانشگاهی و استفاده از نیروهای جوان و مستعد دانشگاهی و تکیه بر خلاقیتهای جهادگرانه آنان در فعالیتهای تحقیقاتی است.
از لحاظ تشکیلاتی ایسپا زیر نظر رئیس جهاد دانشگاهی بوده و توسط هیئت مدیره اداره میشود. همچنین ایسپا دارای 4 معاونت، پژوهشی ( با پنج گروه تخصصی(گروه تحقیقات بازار، گروه مطالعات سیاسی و رفتار انتخاباتی، گروه مطالعات شهری، گروه مطالعات اجتماعی و فرهنگی و گروه مطالعات پایه) ) ،اجرائی (مشتمل بر گروههای نمونهگیری، پرسشگری ,گروه آموزش و دادهپردازی) ، ارتباطاتو پشتیبانیاست. دراین مرکز حدود 45 نفر از پژوهشگران و محققان برجسته کشور که در زمینه تحقیقات اجتماعی تخصص دارند، فعالیت میکنند. همچنین در حدود 5000 نفر دانشجو (بعنوان پرسشگر) با آن همکاری افتخاری دارند.
یکی از اهداف مهم ایسپا در طی مدت فعالیت، تولید و توسعه دانش فنی و تکنولوژی اجرای تحقیقات پیمایشی در استانهای محروم و دور افتاده و بهره مند کردن نظام تصمیم گیری منطقهای و محلی از روشهای اجرای مدیریت مشارکتیدر امور بوده که ماحصل این مهم، توسعه شعب مرکز افکارسنجی دانشجویان ایران به 28 استان طی مدت فعالیت بوده است. شعب این مرکز در حال حاضر از توانایی حرفه ای مطلوبی در اجرای بررسیهای پیمایشی در سطح استانها برخوردار هستند. بهره گیری از چنین پتانسیلی در اجرای طرحهای پژوهشی ، این مرکز را قادر ساخته است که با کمترین هزینه و در کوتاه ترین زمان و همچنین با بیشترین دقت نسبت به اجرای طرحهای پژوهشی اقدام نماید. شعب ایسپا در چارچوب تشکیلات استانی جهاد دانشگاهی و زیر نظر روسای جهاد دانشگاهی فعالیت میکنند و دارای تشکیلات اداری و علمی خاص هستند . شایان ذکر است با توجه به انگیزههای فرهنگی و سیاسی جهاد دانشگاهی در این حوزه، در حدود 5000 نفر دانشجوی افتخاری نیز در سطح شعب ایسپا جذب شده و در حال فعالیت هستند.
ثمره فعالیت جهادگران دانشگاهی در ایسپا در طول فعالیت آن اجرای بیش از 2000 طرح نظرسنجی در زمینه های فرهنگی، اقتصادی، اجتماعی و سیاسی در سطوح مختلف محلی، منطقه ای و ملی است که از نتایج این بررسیها طیف وسیعی از نهادها و سازمانهای تصمیم ساز در بخش دولتی و شرکتهای خصوصی بهره مند شده اند.
یکی از عرصه های ویژه فعالیت ایسپا، نظرسنجی های انتخاباتیاست. این بررسیها در ایام برگزاری انتخابات با تکیه بر منابع داخلی و صرفا به قصد توسعه دانش فنی و پیشبینی بیطرفانه تحولات آتی در زمینه سنجش و شناخت رفتار انتخاباتی اجرا میشوند که نتایج آنها در اختیار مسئولان ذیربط و رسانه های عمومی قرار می گیرد. «گروه رفتار انتخاباتی ایسپا»تاکنون چهار انتخابات مهم کشور شامل دور هشتم انتخابات ریاست جمهوری، دور دوم انتخابات شوراهای اسلامی شهر و روستا، دور هفتم انتخابات مجلس شورای اسلامی و بالاخره دور نهم انتخابات ریاست جمهوری را از طریق بررسی های منظم میدانی مورد مطالعه قرار داده است و با تولید دادهها ی متقن و قابل اتکا برای تحلیل و تخمین رفتار های رای دهی شهروندان ، توانسته است منبع ارزشمندی از داده ها و منابع تئوریک را در ارتباط با سنجش و تحلیل رفتار انتخاباتی در کشور برای استفاده محققان در این حوزه مهیا و فراهم سازد. شایان ذکر است، ایسپا در جریان برگزاری نهمین دوره انتخابات ریاست جمهوری تعداد 70 طرح نظرسنجی را اجراء کرده است.
از یک دیدگاه فعالیتهای پژوهشی ایسپا را میتوان به دو دسته کلی تقسیمبندی کرد:
1- نظرسنجیهای خویش فرماییکه با هدف انعکاس دقیق و سریع افکار عمومی در قبال مسایل مهم جامعه و جهان به اجرا در میآیند و نتایج آنها در اختیار مراجع تصمیمگیر، سازمانهای ذیربط و رسانهها قرار میگیرد. از جمله این نظرسنجیها میتوان به بررسیهای مرکز در خصوص موضوعاتی چون بحران عراق، فعالیتهای هسته ای کشورمان اشاره کرد. انتخابات شورا و ریاست جمهوری، وضعیت و کیفیت خودروهای داخلی، وضعیت اقتصادی شهروندان، آگاهی و آمادگی در برابر زلزله و ..... اشاره نمود.
2- پژوهشهای کارفرماییکه برای پاسخگویی و رفع نیازهای پژوهشی سازمانها و نهادهای دولتی و خصوصی فعال در حوزههای صنعتی ، اقتصادی، اجتماعی و فرهنگی با اهداف متفاوتی چون نیازسنجی و رضایت سنجی خدمات و ارزیابی عملکرد اجرا میشوند. مرکز افکارسنجی در این راستا پژوهشهای مختلفی را به سفارش سازمانها و نهادهای مختلفی چون وزارتخانههای بهداشت و آموزش پزشکی، بازرگانی و کشور، شهرداری تهران، سازمان بهداشت صنعت نفت، شرکت نفت مناطق مرکزی، بانک صنعت و معدن، نیروی انتظامی، بنیاد شهید، ریاست جمهوری، شرکت قطارهای مسافری رجا، سازمان تربیت بدنی ، قوه قضائیه، سازمان انتقال خون ، شرکت سرم سازی رازی، شرکت ساپکو، شرکت سایپا و ..... به اجرا در آورده است .
طرح های نظرسنجی انجام شده ایسپا از لحاظ موضوع به شرح زیر دسته بندی می شوند :
- 1 بخش سیـاسـی
الف)حوزه انتخابات و رفتار انتخاباتی
ب ) حوزه عملکرد مسئولان
ج)حوزه رویدادهای سیاسی
-2 بخش فرهنگی – اجتماعی ، ورزشی
الف)حوزه مذهبی
ب)حوزه ورزشی
ج) حوزه مسایل فرهنگی _ اجتماعی
- 3 بخش اقتصادی
الف) حوزه عملکرد دستگاهها و نهادها
ب ) حوزه تحقیقات بازار و نیازسنجیها
ج) حوزه رضایت شغلی
ایسپا مزیت اصلی فعالیت پژوهشی خود را سرعت، دقت، کاربردی و ارزان بودن آن میداند و میکوشد تا با فعالیتهای پژوهشی خود گامی هر چند کوچک در اعتلای ایران اسلامی بردارد.
http://ispa.ir
نمونهگیری خوشهای و اثر طرح
تفاوت مهم نمونهگیری خوشهای با سایر روشهای نمونهگیری تصادفی این است که در نمونهگیری خوشهای، وجود چارچوب نمونهگیری از کل اعضای جامعه مورد نیاز نیست؛ فقط در خوشههای منتخب چارچوب نمونهگیری مورد نیاز است.
تفاوت دیگر این نوع نمونهگیری با سایر روشهای نمونهگیری تصادفی در این است که در اغلب شرایط، تغییرات، پراکندگی داخل خوشهها بیش از پراکندگی یا تغییرات بین خوشهها میباشد. این موضوع باعث افزایش پراکندگی یا واریانس متغیر مورد اندازهگیری یا ارزیابی وضعیت نمونهگیری خوشهای نسبت به وضعیت غیر از آن (به عنوان مثال نمونهگیری تصادفی ساده) میگردد. یک راهکار اساسی به منظور جبران این افزایش در واریانس یا جبران کاهش در دقت برآورد یا اندازهگیری، افزایش اندازه نمونه میباشد. بر اساس منطق پیشگفت به منظور عملی کردن میزان افزایش در اندازه نمونه در شرایط نمونهگیری درون خوشهای، از ضریبی به نام شاخص اثر طرح یا Design Effect استفاده مینمایند. معمولاً این شاخص دارای اندازهای بزرگتر از یک میباشد. بزرگی این شاخص رابطه مستقیم با پراکندگی یا واریانس داخل خوشهای دارد هر چه این پراکندگی بیشتر باشد، مقدار عددی اثر طرح بزرگتر است. از آنجا که در زمان طراحی مطالعه و تعیین روش نمونهگیری و حجم نمونه، مقدار دقیق اثر طرح نامشخص میباشد، معمولاً برآورد یا پیشبینی تقریبی برای شاخص اثر طرح را در محاسبه اندازه نمونه نهایی لحاظ مینمایند. در اغلب شرایط مقدار عددی اثر طرح را حدود 2-5/1 در نظر میگیرند و به عبارت دیگر عدد اندازه نمونه به دست آمده از فرمولهای محاسبه اندازه نمونه را در این مق
گروه داده کاوی دایکه
- گروه داده کاوی دایکه اولین واحد تخصصی دادهکاوی در استان اصفهان و تیم داده کاوی پیشرو در ایران به شمار می رود.
- چشم انداز دایکه: ورود به بازار جهانی کسب و کار و تبدیل شدن به قطب اجرایی در سطح بین المللی.
- کلمه دایکه مخفف عبارت «روانشناسی داده» در انگلیسی و به معنای مطالعه و بررسی رفتار داده ها است.
- مدرس کارگاه های داده کاوی دایکه پروفسور نخعی زاده است. وی برگزارکننده ی کارگاه های بین المللی آموزش دادهکاوی در آمریکا و کشورهای اروپایی است.
تاریخچه دایکه
اولین واحد تخصصی دادهکاوی
در استان اصفهان
و تیم داده کاوی پیشرو در ایرانگروه دادهکاوی دایکه به عنوان اولینواحد تخصصی دادهکاوی استان اصفهان و از اولین واحدهای تخصصی دادهکاوی در کشور از سال 1386 و با حمایت شهرک علمی و تحقیقاتی اصفهانشروع به کار کرد.
دایکه در ابتدای امر بصورت یک دپارتمان مستقل دادهکاوی در دل شرکت علم پژواک پارستاسیس شد و فعالیت اصلی آن برگزاری کارگاه های دادهکاویدر ایران بود.
اهداف دایکه
فعالیت های دایکه با دو هدف مشخص شروع شد:
- گسترش دادهکاوی در ایران
- اجرای پروژه های دادهکاوی در شرکت ها و سازمان های کشور
با توجه به پیشرفت در سال های اولیه، چشم انداز میان مدت دایکه به سمت بازار بین المللی تعریف شد:
- ورود به بازار جهانی
- قطب دادهکاوی در سطح بین المللی
چشم انداز دایکه:
ورود به بازار جهانی کسب و کار
و تبدیل شدن به قطب اجرایی
در سطح بین المللی.برای دستیابی به اهداف و چشم انداز های مورد نظر، دایکه خود را ملزم کرد تا ارتباط نزدیکی با مراکز تحقیقاتی، صنعتی و دانشگاهی داخل و خارج کشور برقرار کند.
خدمات دادهکاوی دایکه
- کارگاه های تخصصی داده کاوی دایکه با همکاری پروفسور نخعی زاده و در سطوح آشنایی، مقدماتی، متوسطه و پیشرفته بصورت اختصاصی برای سازمان ها و شرکت ها برگزار می شود.
- کارگاه های تخصصی داده کاوی دایکه با همکاری پروفسور نخعی زاده و در سطوح آشنایی، مقدماتی، متوسطه و پیشرفته بصورت اختصاصی برای سازمان ها و شرکت ها برگزار می شود.
کلاس های آموزش دادهکاوی
کلاس های آموزشی دایکه با تاکید بر چگونگی اجرای مفاهیم و دانش تئوریک در پروژه های کاربردی طراحی و برنامه ریزی شده است.
شرکت کنندگان در این دوره ها قادر خواهند بود پس از پایان این دوره ها فرآیند داده کاوی را بصورت نرم افزاری پیاده سازی کنند.
جزئیات بیشتر: کلاس های آموزش دادهکاوی »
- کارگاه های تخصصی داده کاوی دایکه با همکاری پروفسور نخعی زاده و در سطوح آشنایی، مقدماتی، متوسطه و پیشرفته بصورت اختصاصی برای سازمان ها و شرکت ها برگزار می شود.
- تا کنون 12 کارگاه تخصصی داده کاوی و با طیف گسترده ای از موضوعات و کاربردها در گروه داده کاوی دایکه برگزار شده است.
- مخاطبان کارگاه «آشنایی» با داده کاوی مدیران ارشد سازمان ها و شرکت ها و مخاطبان کارگاه های «مقدماتی و متوسطه» داده کاوی، دانشجویان و افراد متخصص است.
- کارگاه های «پیشرفته» ی داده کاوی، برای مدیران میانی سازمان ها و شرکت ها و با هدف آشنایی کاربردی و مطالعات موردی دقیق تر برگزار می شود.
جزئیات بیشتر: کارگاه های آموزشی دادهکاوی »
مشاوره دادهکاوی
گروه داده کاوی دایکه در تمامی پروژه های داده کاوی و در کلیه ی مراحل آن ها، خدمات مشاوره داده کاوی ارائه می کند.
خدمات مشاوره داده کاوی دایکه شامل کلیه ی پروژه های سازمان ها و شرکت ها و پایان نامه های کارشناسی ارشد و دکترا می شود.
دایکه از سال 88 تاکنون تجربه مشاوره داده کاوی دارد. 4 پروژه ی داده کاوی در شرکت خودرو سازی سایپا و بیش از 60 مشاوره داده کاوی در پایان نامه های کارشناسی ارشد و دکترا در سابقه ی دایکه وجود دارد.
جزئیات بیشتر: مشاوره دادهکاوی »
اجرای پروژه های دادهکاوی
گروه داده کاوی دایکه آماده اجرای پروژه های داده کاوی در سازمان ها و شرکت ها است.
پروژه ی داده کاوی به دو صورت تحقیقاتی-پایلوت و عملیاتی قابل پیاده سازی است.
دایکه تا کنون چندین پروژه ی پایلوت و عملیاتی داده کاوی را در شرکت ذوب آهن اصفهان به اجرا گذاشته است.
پروژه های عملیاتی با فرض اعمال شدن در فرایند تولید یک شرکت به اجرا در می آیند در حالی که پروژه های تحقیقاتی-پایلوت اینطور نیستند و تنها برای بررسی و کشف واقعیت های پنهان یک سازمان یا یک شرکت تعریف می شوند.
http://www.dayche.com
آزمون هاسمن
آزمون هاسمن یکی از ازمونهای اصلی در مطالعات پانل می باشد.و می توان گفت که دومین ازمون بعد از ازمون poolability test می باشد.به صورتی که اگر در ازمون poolability تشخیص داده شود که می توان برای تمام مقاطع یا زمانهای شامل در مطالعه عرض از مبداء های جداگانه در نظر گرفت، یعنی الگوی اثرات ثابت گروهی یا زمانی،محقق باید به تخمین اثرات تصادفی گروهی یا زمانی نیز مبادرت ورزد و سپس با استفاده از ازمون هاسمن به بحث انتخاب بین الگوی اثرات ثابت و اثرات تصادفی بپردازد. فرض اصلی در الگوی اثرات ثابت این است که جزء خطا می تواند با متغیرهای توضیحی همبسته باشد البته با جزء خطای ثابت در زمان یعنیtime invarying،مثلا جنسیت فرد در طی زمان تغییر نمی کند یا رنگ پوست شخص ، اما در الگوی اثرات تصادفی فرض می شود که همبستگی بین جزء خطاء با متغیرهای توضیحی وجود ندارد.ازمون هاسمن از معیار کای-دو استفاده می کند در صورتی که احتمال اماره ازمون بیش از 0.1 باشد در سطح معنی داری 90 درصد می توانیم اثرات تصادفی را به اثرات ثابت ترجیح دهیم در غیر این صورت اثرات ثابت انتخاب می شود.
نظرسنجی در گالوپ
هدف نظر سنجی های موسسه گالوپ در کشورهای مختلف نشان دادن نظرات کل مردم با استفاده از نمونه گیری احتمالی است. اکثر نظر سنجی های گالوپ در ایالات متحده به صورت مصاحبه های انجام شده با استفاده از تلفن ثابت و تلفن های همراه است. به طور کلی، گالوپ جامعه آماری خودر را "بزرگسالان ملی"به نمایندگی از تمام بزرگسالان، (18 ساله و بالاتر در نظر می گیرد که در ایالات متحده زندگی می کنند.
موسسه گالوپ در ایالات متحده نمونه گیری را با استفاده از روش (RDD) با استفاده از تمام شماره تلفن های موجود و با استفاده از طر حهای نمونه گیری طبقه ای متناسب با اندازه انجام می دهد. در این روش به تعداد اندازه نمونه، رایانه شماره تلفن تولید می کند. برای تولید اعداد، سه رقم اول شماره تلفنهای محلی به رایانه داده می شود و بقیه رقم ها را رایانه تولید می کند. در این روش امکان تولید تمام شماره تلفنها وجود دارد.
در صورت برقراری تماس با تلفن ثابت، نمونه از فرد بالای 18 سال آن خانوار که تاریخ تولدی نزدیک به تاریخ برقراری ارتباط را دارد تکمیل خواهد شد. در این روش نیازی به درخواست اطلاعات از خانوار مورد نظر در باره فهرست افراد بالای 18 سال آن خانوار نیست. البته موسسه گالوپ از این شیوه در زمان برقراری ارتباط از طریق تلفن همراه استفاده نمی کند (نمونه را از همان فرد پاسخ دهنده تکمیل می کند).
با انتخاب افراد به صورت تصادفی تمام افراد شانسی برابر برای انتخاب شدن را دارند. اندازه نمونه ای که گالوپ به صورت معمول برای نظرسنجی های خود در نظر می گیرد برابر با 1000 نمونه است که با حاشیه خطای 4 ± درصد همراه است.
ذکر این نکته ضروری است که افزایش تعداد نمونه تنها اندکی دقت را بهبود می بخشد. دلیل موفقیت نظر سنجی های گالوپ در نظر گرفتن نمونه مکفی برای تمام زیر گروه ها در جوامع آماری مورد نظر است.
پس از جمع آوری و پردازش داده های پژوهش، پژوهشگران گالوپ نتایج را با استفاده از وزن های بدست آمده از متغیرهای جمعیت شناختی جمعیت بزرگسال که توسط اداره آمار ایالات متحده (بر اساس آخرین سرشماری )در اختیار آنها قرار میگیرد را اصلاح و منتشر می کنند.
وزن های تعیین شده برا ساس داده های سرشماری برای متغیرهای جنس، نژاد، سن، تحصیلات، و منطقه محل سکونت است.
درخت تصمیم با استفاده از نرم افزار R
> library("party")
> str(iris)
'data.frame': 150 obs. of 5 variables:
$ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
$ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
$ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
$ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
$ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
قوانین پیوند در داده کاوی
تعيين ارتباط اقلام مختلف با يکديگر در مجموعه اطلاعات ورودی.
حمايت و اطمينان: معيارهای ارزيابی ارتباط.
مثال:
در يک فروشگاه زنجيره ای، معمولا چه کالاهائی با هم خريده
می شوند؟
چينش محصولات در فروشگاه
تخفيفها و جايزه های هدف دار
کشف قواعد پیوند
مشتریان یک رستوران بنا به ذائقه شان سفارش غذا می دهند.
تشخيص قوانين پیوند
الگوريتم Apriori
حمايت: P(A U B) احتمال وقوع دو قلم A و B
اطمينان: P(A|B)
هر تک قلمی که از حداقل حمايت برخوردار باشد، يک کانديد قانون پیوند است.
مجموعه اقلام متداول، شامل تمام ابرمجموعه های کانديداهای قوانين پیوند است.
ابر مجموعه يک مجموعه غيرمتداول، نمی تواند متداول باشد.
هر مجموعه اقلام متداول به تمام دو زيرمجموعه های ممکن تقسيم شده و اطمينان قوانين حاصل محاسبه می شود.
{P1, P2, P3}: P1 -> {P2, P3}, {P2, P3} -> P1
توزیع ها در R
یکی از توانایی هایی که هر متخصص آمار باید به خوبی با آن آشنایی داشته باشد، تولید اعداد تصادفی است. یا به عبارت دقیق تر شبیه سازی از یک توزیع داده شده، نرم افزار Rاین توانایی را دارد که آن را در اختیار کاربران خود قرار میدهد. که به یکی از دو صورت زیر از یک توزیع احتمالی عدد تصادفی تولید یا شبیه ساری کند.
الف)تولید اعداد تصادفی از توزیع های شناخته شده و معروف
ب) تولید اعداد تصادفی از هر توزیع به کمک روش (MH)
محاسبه تابع گاما با استفاده از شبیه سازی مونت کارلو
در نرم افزار R به سادگی با استفاده از تابع gamma می توان مقدار تابع گاما را محاسبه نمود. به عنوان مثال داریم:
> gamma(2)
[1] 1
> gamma(0.5)
[1] 1.772454
> gamma(1.5)
[1] 0.8862269
> gamma(5)
[1] 24
حال با شبیه سازی به سادگی می توان مقدار تابع گاما را محاسبه نماییم. کافیست که به تعداد زیاد از تابع چگالی نمایی با میانگین 1 نمونه تولید گردد و سپس برای محاسبه تابع گاما a میانگین توان (a-1) مقادیر شبیه شده را بدست آوریم. به عنوان مثال برای محاسبه تابع گاما 3.5 که برابر مقدار 3.323351 می باشد، به ترتیب 1000 و 10000 نمونه از تابع نمایی اخذ نموده و سپس با میانگیت به توان 2.5 این نمونه، تقریب مونت کارلو را برای مقدارد دقیق داریم:
> set.seed(123)
> gamma(3.5)
[1] 3.323351
> mean(rexp(n=1000)^2.5);
[1] 3.41193
> mean(rexp(n=10000)^2.5);
[1] 3.320106
آموزش رایگان آمار در سطوح لیسانس و فوق لیسانس
توجه:
** این اقدام تا پایان سال 93 انجام می پذیرد**
** حداقل تعداد جهت تشکیل یک کلاس 2 نفر می باشد، و امکان درخواست همزمان چند نفر وجود دارد***
*** ترجیحا کلاس های در محل تدریس بنده صورت می پذیرد و درخواست دیگر نیز قابل بررسی می باشد***
درخواست های خود را به آدرس ntazikeh@gmail.com ارسال نمایید تا اقدام لازم جهت هماهنگی صورت پذیرد.
با بهترین آرزوها-تازیکه
09300023999
آموزش رایگان نرم افزارهای آماری SPSS-Minitab-R-SPLUS
مزید اطلاع می باشد لازم است به جهت بهره برداری بیشتر از کلاس هماهنگی دو هفته قبل صورت پذیرد
همچنین به اطلاع می رساند در صورت نیاز آمادگی ارایه مختصری از چند نرم افزار نیز در یک جلسه وجود دارد
توجه:
*** این اقدام تا پایان سال 93 انجام می پذیرد**
** حداقل تعداد جهت تشکیل یک کلاس 4 نفر می باشد، و امکان درخواست همزمان چند نفر وجود دارد***
*** ترجیحا کلاس های در محل تدریس بنده صورت می پذیرد و درخواست دیگر نیز قابل بررسی می باشد***
درخواست های خود را به آدرس ntazikeh@gmail.com ارسال نمایید تا اقدام لازم جهت هماهنگی صورت پذیرد.
با بهترین آرزوها-تازیکه
09300023999
تدریس/آموزش نرم افزارهای آماری SPSS، R، Minitab، SAS و ...
بدینوسیله به اطلاع متقاضیان آموزش نرم افزارهای آماری SPSS، R، Minitab، SAS و ... می رساند مدرسین خبره و مجرب که سالها تجربه کار عملی و آموزشی دارند نسبت به تدریس خصوصی مبتنی بر نیاز فراگیران اقدام نموده اند. لذا هر گونه تقاضایی در این زمینه قابل بررسی و پاسخگویی می باشد.
با توجه به اختصاصی بودن آموزش ها، سرفصل، زمان برگزاری، سرعت پیشروی و .. به درخواست فراگیر بوده و پس از دوره ها نیز تیم آموزش دهنده ملزم به پاسخگویی با شرایط خاص می باشد.
مبنای محاسبه شهریه دوره های نرم افزاری به شرح حدول زیر اعلام می گردد:
| ردیف | محل برگزاری | حداقلشهریه دوره (به ازای هر ساعت/تومان) | توضیحات | |||
| انفرادی | 2 نفره | 3 یا 4 نفره | بالای 4نفر | |||
| 1 | در محل مدرس(بدون رایانه) | 35.000 | 45.000 | 55.000 | - | |
| 2 | در محل مدرس(با رایانه) | 40.000 | 55.000 | 65.000 | - | |
| 3 | در محل فراگیر | 50.000 | 55.000 | 65.000 | 75.000 | |
توضیحات:
| ||||||
فراگیران محترم می توانند جهت کسب اطلاعات بیشتر از طریق ایمیل های زیر اقدام نمایند و در صورت نیاز، ضمن درج شماره تماس خود در پیام ارسالی، منتظر تماس از طرف ما باشند.
همچنین به اطلاع می رساند ضمن ثبت نام در خبرنامه، از دوره های رایگان آموزش نرم افزاری برخوردار شوید.
با تشکر
تازیکه
09300023999
مولفه های بیمه غیر عمر
فرآیند ادعا در بیمه های غیر عمر متشکل از دو مولفه می باشد: فراوانی ادعا و شدت ادعا، به طوری که حاصلضرب امید ریاضی نرخ ادعا و امید ریاضی شدت ادعا حق بیمه خالص یا مخاطره ای را تعریف می کند.
امروزه برای مدل بندی این مولفه ها از پتانسیل بالای GLM ها در استفاده از کوواریت ها استفاده می شود (ARTHUR E. RENSHAW(1994) austin bulletin)و همچنین برای بررسی وابستگی و در صورت وجود مدل بندی آن از توابع مفصل.
با استفاده از مدلهای تعمیم یافته خطی می توان تواما حضور متغیرهای پیوسته، گسسته و یا ترکیبی از آنها را در مدل بندی استفاده نمود.
داده های آماری
بسیار در پی داده های واقعی جهت تحلیل های آماری خود هستیم و بدون هدف به جاهای مختلفی فکر میکنیم.
برای چنین منظوری چند محل سهل الوصول برای دسترسی به داده ها وجود دارد:
1- نرم افزارهای آماری: در تمامی نرم افزارهای آماری که امکان آموزش و راهنمایی در آنها تعبیه شده است (SPSS، R و ...) مجموعه داده ها ی واقعی زیادی وجود دارد که به سادگی قابل دسترسی هستند.
2- پایگاههای داده رایگان: وب سایت های گوناگونی داده هایی را تمرین پروژه های کلاسی و دانشگاهی ارائه نموده اند که در اینترنت به سادگی قابل دسترسی هستند به عنوان مثال تعدادی از آنها عبارتند از:
3- سایت های با حوزه های تخصصی در سری زمانی (لینک 1، لینک 2، لینک 3 ...)،
4-مراجعه با شرکت ها و نهادهای دارای پایگاه داده مانند سازمان هواشناسی
امید است با تکمیل و ثبت ایرادات این پست، شما هم به محققین و دانشجویان عزیز کمک و همیاری نمایید.
پروژه تحلیلی 101
در ادامه مطلب، تحلیلی شامل "بررسی تاثیر دو متغیر سن و جنس بر زمان عکس العمل از طریق نرم افزار spss"را به عنوان یک پروژه آماری سطح متوسط میتوانید دانلود کنید.
به همین منوال در روزهای آتی به پروژه های دیگر بارگذاری خواهد شد امید است شما نیز با در اختیار گذاشتن پروژه خود جهت درج در وبلاگ، ما در این امر یاری کنید.
