در تمام نظرسنجی های صورت گرفته در مراکز افکارسنجی و تحقیقاتی، وجود خطا در نتایج امری غیر قابل انکار است. مسأله مهم این است که معمولا خطا ناچیز است و می توان نتایج را با دقت خوبی پذیرفت. اما گاهی خطاها چنان بزرگ هستند که نمی توان مشت را نمونه خروار دانست. نظرسنجی های اینترنتی که در سایت های مختلف قرار دارد نیز همانند سایر نظرسنجی هایی که سازمان های مختلف دولتی و غیر دولتی و مراکز افکارسنجی انجام می دهند، با خطا همراه است اما این خطا در چه اندازه ای است جای تامل دارد؟ آیا میزان خطا به گونه ای است که بتوان نتایج مورد نظر را به جامعه تعمیم داد؟ آیا می توان گفت نمونه مورد نظر یک نمونه واقعی است؟
در پاسخ باید گفت که جامعه آماری برای انجام نظرسنجی های اینترنتی متفاوت است، معمولاً افراد تشکیل دهنده جامعه آماری برای طرح های نظرسنجی گوناگون از لحاظ متغیرهای جمعیت شناختی دارای پراکندگی های زیادی هستند. به طور مثال در نظرسنجی های مربوط به انتخابات ریاست جمهوری، جامعه آماری شامل تمامی افراد بالای 18 سال سراسر کشور می باشد که در تمامی روستاها و شهرهای کشور پراکنده هستند. گردآوری نمونه معرف، زماني امكان پذير است كه نمونه های انتخابی كليه صفات و ويژگي هاي جامعه آماري مورد نظر را دارا باشند و بتوان آنها را نماینده کل جامعه به حساب آورد. یعنی نمونه‌ای می تواند قابلیت تعمیم داشته باشد که دو ویژگی ذیل را دربر گیرد:
1-روايي نمونه آماري:
روايي نمونه آماري به این معنی است كه بتوان نمونه مورد مطالعه را از نظر همگوني با جامعه مورد مطالعه و دارا بودن ويژگي‌‌‌ ها و صفات آن، بخشي از جامعه آماري تلقي کرد تا بتواند قابلیت تعمیم داشته باشد. همچنین در روش های نمونه گیری احتمالی تمام واحدهای جامعه بایستی شانس یکسانی برای حضور در نمونه نهایی را داشته باشند. در نظر سنجی های اینترنتی نمونه بدست آمده تنها بخش خاصی از جامعه را پوشش می دهد (تنها افرادی که برای آنها امکان دسترسی به اینترنت وجود دارد) و قسمت عمده ای از جامعه آماری شانس حضور در نظرسنجی را ندارند . آیا زیرساخت الکترونیکی لازم برای یک فرد روستایی در دورترین نقاط این مرز و بوم برای مراجعه به سایت های مورد نظر وجود دارد تا نظر خودش را انعکاس دهد؟ آیا افراد مسن به سایت های اینترنتی دسترسی دارند و یا در صورت دسترسی، علاقه ای به سایت های برگزار کننده نظرسنجی اینترنتی دارند؟ آیا اطلاع دارند که چه سایتهایی نظرسنجی اینترنتی را انجام می دهند؟
2- تناسب حجمي نمونه آماري:
تناسب حجمي نمونه مورد مطالعه زمانی رعایت می شود كه در نمونه گردآوری شده، اندازه كافي و مناسبی از افراد با در نظر گرفتن تمام متغیرهای جمعیت شناختی، حضور داشته باشند (جنسیت، سن، محل سکونت، وضعیت اشتغال، و ضعیت تحصیلات)، به طوري که از نظر كمي بتوان آن را نماینده جامعه آماري تلقي كرد و بتوان نتايج مطالعه را به جامعه تعميم داد. معمولاً در نظرسنجی های اینترنتی تعداد نمونه مکفی از تمام زیرگروه های جامعه آماری (بر حسب متغیرهای جمعیت شناختی) گردآوری نمی شود و افراد مراجعه کننده به سایت ها شامل گروه های خاصی هستند.
علاوه بر موارد فوق نکات دیگری نیز از منظر نمونه گیری حایز اهمیت است:
- در نظرسنجی های اینترتی امکان تکراری بودن واحد انتخابی از جامعه آماری وجود دارد. به عبارت دیگر یک فرد می تواند چندین مرتبه در نظرسنجی مذکور شرکت کند که این امر با اصل شانس برابر جهت انتخاب شدن تمام افراد جامعه آماری در تناقض است و سبب ایجاد سوگیری در نتایج می شود.
- در نطرسنجی های اینترنتی معمولاً اصل مستقل بودن نتایج حاصل از نمونه های آماری رعایت نمی گردد. افراد شرکت کننده در نظرسنجی های مذکور می توانند نظرات افراد قبلی شرکت کننده را ببینند که این باعث ایجاد اریب در نتایج نهایی می گردد. به عنوان مثال نسبت آراء مخاطبان چند میلیونی برنامه 90 در طول برنامه تغییر چندانی نمی کند( آهنگ نسبت ها و نمودار هر گزینه تقریبا تابع و شبیه آرای اولیه است).
با توجه به موارد ذکر شده در بالا، بدیهی است هر رسانه ای که بتواند بیشترین مخاطب (بر حسب متغیرهای جمعیت شناختی) را در برگیرد و نفرات بیشتری از گروه های مختلف جامعه در چنین نظرسنجی هایی شرکت کنند به تدریج می تواند ادعا کند که توانایی سنجش دقیق افکار عمومی (حداقل مخاطبان وب) را دارد.

↧

معرفی ایسپا(مرکز افکار سنجی دانشجویان ایران)

July 23, 2014, 2:31 am

≫ Next: نمونه‌گیری خوشه‌ای و اثر طرح

≪ Previous: نظرسنجی اینترنتی زیر ذره بین علم آمار

مرکز افکارسنجی دانشجویان ایران (ایسپا) وابسته به جهاد دانشگاهیدر راستای توسعه علمی و تحقیقاتی کشور و با قصد رفع نیاز سازمانها و نهادهای تصمیم گیر ، ضرورت توجه به افکار عمومی و لزوم بهره گیری از مشارکت و دیدگاههای شهروندان در بهبود و توسعه امور کشور در عرصه های مختلف، از سال 1380 فعالیت خود را آغاز کرده است.

اصول بنیادین و اساسی ایسپا در طراحی و اجرای فعالیتهای پژوهشی و نظرسنجی، تاکید بر بکارگیری معیارهای دقیق علمی و فنی ، رعایت و حفظ موضع بی طرفی در قبال مسایل و موضوعات مورد بررسی ؛ استفاده از پشتوانه اعتماد مسئولان و مردم به نهاد ارزشی جهاد دانشگاهی و استفاده از نیروهای جوان و مستعد دانشگاهی و تکیه بر خلاقیتهای جهادگرانه آنان در فعالیتهای تحقیقاتی است.

از لحاظ تشکیلاتی ایسپا زیر نظر رئیس جهاد دانشگاهی بوده و توسط هیئت مدیره اداره می‌شود. همچنین ایسپا دارای 4 معاونت، پژوهشی ( با پنج گروه تخصصی(گروه تحقیقات بازار، گروه مطالعات سیاسی و رفتار انتخاباتی، گروه مطالعات شهری، گروه مطالعات اجتماعی و فرهنگی و گروه مطالعات پایه) ) ،اجرائی (مشتمل بر گروه‌های نمونه‌گیری، پرسشگری ,گروه آموزش و داده‌پردازی) ، ارتباطاتو پشتیبانیاست. دراین مرکز حدود 45 نفر از پژوهشگران و محققان برجسته کشور که در زمینه تحقیقات اجتماعی تخصص دارند، فعالیت می‌کنند. همچنین در حدود 5000 نفر دانشجو (بعنوان پرسشگر) با آن همکاری افتخاری دارند.
یکی از اهداف مهم ایسپا در طی مدت فعالیت، تولید و توسعه دانش فنی و تکنولوژی اجرای تحقیقات پیمایشی در استانهای محروم و دور افتاده و بهره مند کردن نظام تصمیم گیری منطقه‌ای و محلی از روشهای اجرای مدیریت مشارکتیدر امور بوده که ماحصل این مهم، توسعه شعب مرکز افکارسنجی دانشجویان ایران به 28 استان طی مدت فعالیت بوده است. شعب این مرکز در حال حاضر از توانایی حرفه ای مطلوبی در اجرای بررسیهای پیمایشی در سطح استان‌ها برخوردار هستند. بهره گیری از چنین پتانسیلی در اجرای طرحهای پژوهشی ، این مرکز را قادر ساخته است که با کمترین هزینه و در کوتاه ترین زمان و همچنین با بیشترین دقت نسبت به اجرای طرحهای پژوهشی اقدام نماید. شعب ایسپا در چارچوب تشکیلات استانی جهاد دانشگاهی و زیر نظر روسای جهاد دانشگاهی فعالیت می‌کنند و دارای تشکیلات اداری و علمی خاص هستند . شایان ذکر است با توجه به انگیزه‌های فرهنگی و سیاسی جهاد دانشگاهی در این حوزه، در حدود 5000 نفر دانشجوی افتخاری نیز در سطح شعب ایسپا جذب شده و در حال فعالیت هستند.
   ثمره فعالیت جهادگران دانشگاهی در ایسپا در طول فعالیت آن اجرای بیش از 2000 طرح نظرسنجی در زمینه های فرهنگی، اقتصادی، اجتماعی و سیاسی در سطوح مختلف محلی، منطقه ای و ملی است که از نتایج این بررسیها طیف وسیعی از نهادها و سازمانهای تصمیم ساز در بخش دولتی و شرکت‌های خصوصی بهره مند شده اند.
   یکی از عرصه های ویژه فعالیت ایسپا، نظرسنجی های انتخاباتیاست. این بررسیها در ایام برگزاری انتخابات با تکیه بر منابع داخلی و صرفا به قصد توسعه دانش فنی و پیش‌بینی بیطرفانه تحولات آتی در زمینه سنجش و شناخت رفتار انتخاباتی اجرا می‌شوند که نتایج آنها در اختیار مسئولان ذیربط و رسانه های عمومی قرار می گیرد. «گروه رفتار انتخاباتی ایسپا»تاکنون چهار انتخابات مهم کشور شامل دور هشتم انتخابات ریاست جمهوری، دور دوم انتخابات شوراهای اسلامی شهر و روستا، دور هفتم انتخابات مجلس شورای اسلامی و بالاخره دور نهم انتخابات ریاست جمهوری را از طریق بررسی های منظم میدانی مورد مطالعه قرار داده است و با تولید داده‌ها ی متقن و قابل اتکا برای تحلیل و تخمین رفتار های رای دهی شهروندان ، توانسته است منبع ارزشمندی از داده ها و منابع تئوریک را در ارتباط با سنجش و تحلیل رفتار انتخاباتی در کشور برای استفاده محققان در این حوزه مهیا و فراهم سازد. شایان ذکر است، ایسپا در جریان برگزاری نهمین دوره انتخابات ریاست جمهوری تعداد 70 طرح نظرسنجی را اجراء کرده است.
   از یک دیدگاه فعالیت‌های پژوهشی ایسپا را می‌توان به دو دسته کلی تقسیم‌بندی کرد:
1- نظرسنجی‌های خویش فرماییکه با هدف انعکاس دقیق و سریع افکار عمومی در قبال مسایل مهم جامعه و جهان به اجرا در می‌آیند و نتایج آنها در اختیار مراجع تصمیم‌گیر، سازمانهای ذیربط و رسانه‌ها قرار می‌گیرد. از جمله این نظرسنجی‌ها می‌توان به بررسیهای مرکز در خصوص موضوعاتی چون بحران عراق، فعالیت‌های هسته ای کشورمان اشاره کرد. انتخابات شورا و ریاست جمهوری، وضعیت و کیفیت خودروهای داخلی، وضعیت اقتصادی شهروندان، آگاهی و آمادگی در برابر زلزله و ..... اشاره نمود.
2- پژوهشهای کارفرماییکه برای پاسخگویی و رفع نیازهای پژوهشی سازمانها و نهادهای دولتی و خصوصی فعال در حوزه‌های صنعتی ، اقتصادی، اجتماعی و فرهنگی با اهداف متفاوتی چون نیازسنجی و رضایت سنجی خدمات و ارزیابی عملکرد اجرا می‌شوند. مرکز افکارسنجی در این راستا پژوهش‌های مختلفی را به سفارش سازمانها و نهادهای مختلفی چون وزارتخانه‌های بهداشت و آموزش پزشکی، بازرگانی و کشور، شهرداری تهران، سازمان بهداشت صنعت نفت، شرکت نفت مناطق مرکزی، بانک صنعت و معدن، نیروی انتظامی، بنیاد شهید، ریاست جمهوری، شرکت قطارهای مسافری رجا، سازمان تربیت بدنی ، قوه قضائیه، سازمان انتقال خون ، شرکت سرم سازی رازی، شرکت ساپکو، شرکت سایپا و ..... به اجرا در آورده است .
طرح های نظرسنجی انجام شده ایسپا از لحاظ موضوع به شرح زیر دسته بندی می شوند :
- 1 بخش سیـاسـی
الف)حوزه انتخابات و رفتار انتخاباتی
ب ) حوزه عملکرد مسئولان
ج)حوزه رویدادهای سیاسی
-2 بخش فرهنگی – اجتماعی ، ورزشی
الف)حوزه مذهبی
ب)حوزه ورزشی
ج) حوزه مسایل فرهنگی _ اجتماعی
- 3 بخش اقتصادی
الف) حوزه عملکرد دستگاهها و نهادها
ب ) حوزه تحقیقات بازار و نیازسنجی‌ها
ج) حوزه رضایت شغلی
    ایسپا مزیت اصلی فعالیت پژوهشی خود را سرعت، دقت، کاربردی و ارزان بودن آن می‌داند و می‌کوشد تا با فعالیت‌های پژوهشی خود گامی هر چند کوچک در اعتلای ایران اسلامی بردارد.

http://ispa.ir

↧

نمونه‌گیری خوشه‌ای و اثر طرح

July 23, 2014, 2:37 am

≫ Next: گروه داده کاوی دایکه

≪ Previous: معرفی ایسپا(مرکز افکار سنجی دانشجویان ایران)

روش نمونه‌گیری خوشه‌ای، وقتی به کار می‌رود که فهرست کامل افراد جامعه در دسترس نباشد. به این منظور واحدهای جامعه را در دسته‌هایی خوشه‌بندی می‌کنند سپس از میان خوشه‌ها نمونه‌گیری به عمل می‌آورند. در این روش در مرحله ابتدایی باید از بین خوشه‌های تشکیل دهنده جامعه یا جمعیت مورد بررسی، تعدادی خوشه را انتخاب کنیم. نحوه انتخاب خوشه‌ها می‌تواند تصادفی ساده یا منظم باشد. پس از انتخاب خوشه‌های مورد نظر وارد مرحله بعدی این نوع نمونه‌گیری می‌شویم. در این مرحله دو انتخاب اساسی داریم: در انتخاب اول کلیه اعضای خوشه‌های منتخب را مورد بررسی و ارزیابی قرار می‌دهیم. به عبارت دیگر کلیه اعضای خوشه به عنوان اندازه نمونه مطالعه در نظر گرفته می‌شوند به این شیوه نمونه‌گیری خوشه‌ای، نمونه‌گیری خوشه‌ای یک مرحله‌ای (Single stage cluster sampling) اطلاق می‌گردد. در انتخاب دوم از بین کلیه اعضای خوشه یا خوشه‌‌های انتخاب شده، تعدادی از اعضاء به شیوه تصادفی ساده یا منظم انتخاب می‌گردند. به عبارتی، در این حالت در داخل خوشه‌ها نمونه‌گیری انجام می‌دهیم که به این شیوه، نمونه‌گیری خوشه ای دو مرحله‌اي (Double/ two stage cluster sampling) می‌گویند. بدیهی است سطوح انتخاب Cluster ممکن است بیش از دو سطح را شامل شده و در این حالات تعداد سطوح یا مرحله در نام‌گذاری شیوه نمونه‌گیری خوشه‌ای مشخص می‌گردد. به عنوان مثال Three stage cluster sampling یا Four stage cluster sampling نیز می‌توانیم داشته باشیم. به عنوان مثال، در مطالعه ارزیابی شیوع کم خونی در دانش آموزان ابتدایی شهر تهران یک شیوه نمونه‌گیری می‌تواند به صورت زیر باشد: ابتدا از بین 22 منطقه شهر تعدادی از مناطق به صورت تصادفی ساده انتخاب می‌‌شوند (5 منطقه)، لیستی از مدارس ابتدایی مناطق پنج گانه انتخاب شده تهیه می‌کنیم و سپس 10 دبستان در هر منطقه به صورت تصادفی ساده انتخاب می‌گردد و در نهایت در هر دبستان انتخاب شده 50 دانش آموز به صورت تصادفی منظم براساس لیست حروف الفبایی انتخاب می‌گردند که با کمی دقت در می یابیم این شیوه نمونه‌گیری، نمونه‌گیری خوشه‌ای سه مرحله‌ای می‌باشد.
تفاوت مهم نمونه‌گیری خوشه‌ای با سایر روش‌های نمونه‌گیری تصادفی این است که در نمونه‌گیری خوشه‌ای، وجود چارچوب نمونه‌گیری از کل اعضای جامعه مورد نیاز نیست؛ فقط در خوشه‌های منتخب چارچوب نمونه‌گیری مورد نیاز است.
تفاوت دیگر این نوع نمونه‌گیری با سایر روش‌های نمونه‌گیری تصادفی در این است که در اغلب شرایط، تغییرات، پراکندگی داخل خوشه‌ها بیش از پراکندگی یا تغییرات بین خوشه‌ها می‌باشد. این موضوع باعث افزایش پراکندگی یا واریانس متغیر مورد انداز‌ه‌گیری یا ارزیابی وضعیت نمونه‌گیری خوشه‌ای نسبت به وضعیت غیر از آن (به عنوان مثال نمونه‌گیری تصادفی ساده) می‌گردد. یک راهکار اساسی به منظور جبران این افزایش در واریانس یا جبران کاهش در دقت برآورد یا اندازه‌گیری، افزایش اندازه نمونه می‌باشد. بر اساس منطق پیشگفت به منظور عملی کردن میزان افزایش در اندازه نمونه در شرایط نمونه‌گیری درون خوشه‌ای، از ضریبی به نام شاخص اثر طرح یا Design Effect استفاده می‌نمایند. معمولاً این شاخص دارای اندازه‌ای بزرگ‌تر از یک می‌باشد. بزرگی این شاخص رابطه مستقیم با پراکندگی یا واریانس داخل خوشه‌ای دارد هر چه این پراکندگی بیشتر باشد، مقدار عددی اثر طرح بزرگ‌تر است. از آنجا که در زمان طراحی مطالعه و تعیین روش نمونه‌گیری و حجم نمونه، مقدار دقیق اثر طرح نامشخص می‌باشد، معمولاً برآورد یا پیش‌بینی تقریبی برای شاخص اثر طرح را در محاسبه اندازه نمونه نهایی لحاظ می‌نمایند. در اغلب شرایط مقدار عددی اثر طرح را حدود 2-5/1 در نظر می‌گیرند و به عبارت دیگر عدد اندازه نمونه به دست آمده از فرمول‌های محاسبه اندازه نمونه را در این مق

↧

گروه داده کاوی دایکه

July 23, 2014, 2:55 am

≫ Next: آزمون هاسمن

≪ Previous: نمونه‌گیری خوشه‌ای و اثر طرح

گروه داده کاوی دایکه اولین واحد تخصصی داده‏کاوی در استان اصفهان و تیم داده کاوی پیشرو در ایران به شمار می رود.
چشم انداز دایکه: ورود به بازار جهانی کسب و کار و تبدیل شدن به قطب اجرایی در سطح بین المللی.
کلمه دایکه مخفف عبارت «روانشناسی داده» در انگلیسی و به معنای مطالعه و بررسی رفتار داده ها است.
مدرس کارگاه های داده کاوی دایکه پروفسور نخعی زاده است. وی برگزارکننده ی کارگاه های بین المللی آموزش داده‏کاوی در آمریکا و کشورهای اروپایی است.
تاریخچه دایکه
اولین واحد تخصصی داده‏کاوی
در استان اصفهان
و تیم داده کاوی پیشرو در ایران
گروه داده‏کاوی دایکه به عنوان اولینواحد تخصصی داده‏کاوی استان اصفهان و از اولین واحدهای تخصصی داده‏کاوی در کشور از سال 1386 و با حمایت شهرک علمی و تحقیقاتی اصفهانشروع به کار کرد.
دایکه در ابتدای امر بصورت یک دپارتمان مستقل داده‏کاوی در دل شرکت علم پژواک پارستاسیس شد و فعالیت اصلی آن برگزاری کارگاه های داده‏کاویدر ایران بود.
اهداف دایکه
فعالیت های دایکه با دو هدف مشخص شروع شد:
- گسترش داده‏کاوی در ایران
- اجرای پروژه های داده‏کاوی در شرکت ها و سازمان های کشور
با توجه به پیشرفت در سال های اولیه، چشم انداز میان مدت دایکه به سمت بازار بین المللی تعریف شد:
- ورود به بازار جهانی
- قطب داده‏کاوی در سطح بین المللی
چشم انداز دایکه:
ورود به بازار جهانی کسب و کار
و تبدیل شدن به قطب اجرایی
در سطح بین المللی.
برای دستیابی به اهداف و چشم انداز های مورد نظر، دایکه خود را ملزم کرد تا ارتباط نزدیکی با مراکز تحقیقاتی، صنعتی و دانشگاهی داخل و خارج کشور برقرار کند.
خدمات داده‏کاوی دایکه
- کارگاه های تخصصی داده کاوی دایکه با همکاری پروفسور نخعی زاده و در سطوح آشنایی، مقدماتی، متوسطه و پیشرفته بصورت اختصاصی برای سازمان ها و شرکت ها برگزار می شود.
- آموزش داده‏کاوی
- کارگاه های تخصصی داده کاوی دایکه با همکاری پروفسور نخعی زاده و در سطوح آشنایی، مقدماتی، متوسطه و پیشرفته بصورت اختصاصی برای سازمان ها و شرکت ها برگزار می شود.
- جزئیات بیشتر: آموزش داده‏کاوی »
- کلاس های آموزش داده‏کاوی
  کلاس های آموزشی دایکه با تاکید بر چگونگی اجرای مفاهیم و دانش تئوریک در پروژه های کاربردی طراحی و برنامه ریزی شده است.
  شرکت کنندگان در این دوره ها قادر خواهند بود پس از پایان این دوره ها فرآیند داده کاوی را بصورت نرم افزاری پیاده سازی کنند.
  جزئیات بیشتر: کلاس های آموزش داده‏کاوی »
- کارگاه های آموزشی داده‏کاوی
- کارگاه های تخصصی داده کاوی دایکه با همکاری پروفسور نخعی زاده و در سطوح آشنایی، مقدماتی، متوسطه و پیشرفته بصورت اختصاصی برای سازمان ها و شرکت ها برگزار می شود.
- تا کنون 12 کارگاه تخصصی داده کاوی و با طیف گسترده ای از موضوعات و کاربردها در گروه داده کاوی دایکه برگزار شده است.
- مخاطبان کارگاه «آشنایی» با داده کاوی مدیران ارشد سازمان ها و شرکت ها و مخاطبان کارگاه های «مقدماتی و متوسطه» داده کاوی، دانشجویان و افراد متخصص است.
- کارگاه های «پیشرفته» ی داده کاوی، برای مدیران میانی سازمان ها و شرکت ها و با هدف آشنایی کاربردی و مطالعات موردی دقیق تر برگزار می شود.
- جزئیات بیشتر: کارگاه های آموزشی داده‏کاوی »
- مشاوره داده‏کاوی
  گروه داده کاوی دایکه در تمامی پروژه های داده کاوی و در کلیه ی مراحل آن ها، خدمات مشاوره داده کاوی ارائه می کند.
  خدمات مشاوره داده کاوی دایکه شامل کلیه ی پروژه های سازمان ها و شرکت ها و پایان نامه های کارشناسی ارشد و دکترا می شود.
  دایکه از سال 88 تاکنون تجربه مشاوره داده کاوی دارد. 4 پروژه ی داده کاوی در شرکت خودرو سازی سایپا و بیش از 60 مشاوره داده کاوی در پایان نامه های کارشناسی ارشد و دکترا در سابقه ی دایکه وجود دارد.
  جزئیات بیشتر: مشاوره داده‏کاوی »
- اجرای پروژه های داده‏کاوی
  گروه داده کاوی دایکه آماده اجرای پروژه های داده کاوی در سازمان ها و شرکت ها است.
  پروژه ی داده کاوی به دو صورت تحقیقاتی-پایلوت و عملیاتی قابل پیاده سازی است.
  دایکه تا کنون چندین پروژه ی پایلوت و عملیاتی داده کاوی را در شرکت ذوب آهن اصفهان به اجرا گذاشته است.
  پروژه های عملیاتی با فرض اعمال شدن در فرایند تولید یک شرکت به اجرا در می آیند در حالی که پروژه های تحقیقاتی-پایلوت اینطور نیستند و تنها برای بررسی و کشف واقعیت های پنهان یک سازمان یا یک شرکت تعریف می شوند.
  http://www.dayche.com

↧

آزمون هاسمن

July 23, 2014, 5:17 am

≫ Next: نظرسنجی در گالوپ

≪ Previous: گروه داده کاوی دایکه

آزمون هاسمن یکی از ازمونهای اصلی در مطالعات پانل می باشد.و می توان گفت که دومین ازمون بعد از ازمون poolability test می باشد.به صورتی که اگر در ازمون poolability تشخیص داده شود که می توان برای تمام مقاطع یا زمانهای شامل در مطالعه عرض از مبداء های جداگانه در نظر گرفت، یعنی الگوی اثرات ثابت گروهی یا زمانی،محقق باید به تخمین اثرات تصادفی گروهی یا زمانی نیز مبادرت ورزد و سپس با استفاده از ازمون هاسمن به بحث انتخاب بین الگوی اثرات ثابت و اثرات تصادفی بپردازد. فرض اصلی در الگوی اثرات ثابت این است که جزء خطا می تواند با متغیرهای توضیحی همبسته باشد البته با جزء خطای ثابت در زمان یعنیtime invarying،مثلا جنسیت فرد در طی زمان تغییر نمی کند یا رنگ پوست شخص ، اما در الگوی اثرات تصادفی فرض می شود که همبستگی بین جزء خطاء با متغیرهای توضیحی وجود ندارد.ازمون هاسمن از معیار کای-دو استفاده می کند در صورتی که احتمال اماره ازمون بیش از 0.1 باشد در سطح معنی داری 90 درصد می توانیم اثرات تصادفی را به اثرات ثابت ترجیح دهیم در غیر این صورت اثرات ثابت انتخاب می شود.

↧

نظرسنجی در گالوپ

July 23, 2014, 5:24 am

≫ Next: درخت تصمیم با استفاده از نرم افزار R

≪ Previous: آزمون هاسمن

هدف نظر سنجی های موسسه گالوپ در کشورهای مختلف نشان دادن نظرات کل مردم با استفاده از نمونه گیری احتمالی است. اکثر نظر سنجی های گالوپ در ایالات متحده به صورت مصاحبه های انجام شده با استفاده از تلفن ثابت و تلفن های همراه است. به طور کلی، گالوپ جامعه آماری خودر را "بزرگسالان ملی"به نمایندگی از تمام بزرگسالان، (18 ساله و بالاتر در نظر می گیرد که در ایالات متحده زندگی می کنند.

موسسه گالوپ در ایالات متحده نمونه گیری را با استفاده از روش (RDD) با استفاده از تمام شماره تلفن های موجود و با استفاده از طر حهای نمونه گیری طبقه ای متناسب با اندازه انجام می دهد. در این روش به تعداد اندازه نمونه، رایانه شماره تلفن تولید می کند. برای تولید اعداد، سه رقم اول شماره تلفنهای محلی به رایانه داده می شود و بقیه رقم ها را رایانه تولید می کند. در این روش امکان تولید تمام شماره تلفنها وجود دارد.

در صورت برقراری تماس با تلفن ثابت، نمونه از فرد بالای 18 سال آن خانوار که تاریخ تولدی نزدیک به تاریخ برقراری ارتباط را دارد تکمیل خواهد شد. در این روش نیازی به درخواست اطلاعات از خانوار مورد نظر در باره فهرست افراد بالای 18 سال آن خانوار نیست. البته موسسه گالوپ از این شیوه در زمان برقراری ارتباط از طریق تلفن همراه استفاده نمی کند (نمونه را از همان فرد پاسخ دهنده تکمیل می کند).

با انتخاب افراد به صورت تصادفی تمام افراد شانسی برابر برای انتخاب شدن را دارند. اندازه نمونه ای که گالوپ به صورت معمول برای نظرسنجی های خود در نظر می گیرد برابر با 1000 نمونه است که با حاشیه خطای 4 ± درصد همراه است.

ذکر این نکته ضروری است که افزایش تعداد نمونه تنها اندکی دقت را بهبود می بخشد. دلیل موفقیت نظر سنجی های گالوپ در نظر گرفتن نمونه مکفی برای تمام زیر گروه ها در جوامع آماری مورد نظر است.

پس از جمع آوری و پردازش داده های پژوهش، پژوهشگران گالوپ نتایج را با استفاده از وزن های بدست آمده از متغیرهای جمعیت شناختی جمعیت بزرگسال که توسط اداره آمار ایالات متحده (بر اساس آخرین سرشماری )در اختیار آنها قرار میگیرد را اصلاح و منتشر می کنند.

وزن های تعیین شده برا ساس داده های سرشماری برای متغیرهای جنس، نژاد، سن، تحصیلات، و منطقه محل سکونت است.

↧

درخت تصمیم با استفاده از نرم افزار R

July 23, 2014, 8:19 am

≫ Next: قوانین پیوند در داده کاوی

≪ Previous: نظرسنجی در گالوپ

> library("party")

> str(iris)
'data.frame': 150 obs. of 5 variables:
$ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
$ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
$ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
$ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
$ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...

↧

قوانین پیوند در داده کاوی

July 26, 2014, 1:47 am

≫ Next: توزیع ها در R

≪ Previous: درخت تصمیم با استفاده از نرم افزار R

قوانين پیوند (انجمنی)

تعيين ارتباط اقلام مختلف با يکديگر در مجموعه اطلاعات ورودی.

حمايت و اطمينان: معيارهای ارزيابی ارتباط.

مثال:

در يک فروشگاه زنجيره ای، معمولا چه کالاهائی با هم خريده
می شوند؟

چينش محصولات در فروشگاه

تخفيفها و جايزه های هدف دار

کشف قواعد پیوند

Oمشتریان یک فروشگاه به طور تصادفی اجناس را براي خرید انتخاب نمی کنند بلکه با توجه به نیازمندیهایشان خرید می کنند.

Oتراکنشهاي مشتریان بانک از روي نیازشان به انواع خدمات بانک انجام می شود .

Oگردشگران تصادفاً وسیله، هتل و برنامه سفرشان را تهیه نمی کنند بلکه از روي قاعده ناگفته اي این کار را انجام می دهند

مشتریان یک رستوران بنا به ذائقه شان سفارش غذا می دهند.

تشخيص قوانين پیوند

الگوريتم Apriori

حمايت: P(A U B) احتمال وقوع دو قلم A و B

اطمينان: P(A|B)

هر تک قلمی که از حداقل حمايت برخوردار باشد، يک کانديد قانون پیوند است.

مجموعه اقلام متداول، شامل تمام ابرمجموعه های کانديداهای قوانين پیوند است.

ابر مجموعه يک مجموعه غيرمتداول، نمی تواند متداول باشد.

هر مجموعه اقلام متداول به تمام دو زيرمجموعه های ممکن تقسيم شده و اطمينان قوانين حاصل محاسبه می شود.

{P1, P2, P3}: P1 -> {P2, P3}, {P2, P3} -> P1

↧

توزیع ها در R

September 29, 2014, 5:05 am

≫ Next: محاسبه تابع گاما با استفاده از شبیه سازی مونت کارلو

≪ Previous: قوانین پیوند در داده کاوی

یکی از توانایی هایی که هر متخصص آمار باید به خوبی با آن آشنایی داشته باشد، تولید اعداد تصادفی است. یا به عبارت دقیق تر شبیه سازی از یک توزیع داده شده، نرم افزار Rاین توانایی را دارد که آن را در اختیار کاربران خود قرار میدهد. که به یکی از دو صورت زیر از یک توزیع احتمالی عدد تصادفی تولید یا شبیه ساری کند.

الف)تولید اعداد تصادفی از توزیع های شناخته شده و معروف

ب) تولید اعداد تصادفی از هر توزیع به کمک روش (MH)

ادامه مطلب

↧

محاسبه تابع گاما با استفاده از شبیه سازی مونت کارلو

October 27, 2014, 11:59 am

≫ Next: آموزش رایگان آمار در سطوح لیسانس و فوق لیسانس

≪ Previous: توزیع ها در R

با سلام و احترام

در نرم افزار R به سادگی با استفاده از تابع gamma می توان مقدار تابع گاما را محاسبه نمود. به عنوان مثال داریم:

> gamma(2)
[1] 1
> gamma(0.5)
[1] 1.772454
> gamma(1.5)
[1] 0.8862269
> gamma(5)
[1] 24

حال با شبیه سازی به سادگی می توان مقدار تابع گاما را محاسبه نماییم. کافیست که به تعداد زیاد از تابع چگالی نمایی با میانگین 1 نمونه تولید گردد و سپس برای محاسبه تابع گاما a میانگین توان (a-1) مقادیر شبیه شده را بدست آوریم. به عنوان مثال برای محاسبه تابع گاما 3.5 که برابر مقدار 3.323351 می باشد، به ترتیب 1000 و 10000 نمونه از تابع نمایی اخذ نموده و سپس با میانگیت به توان 2.5 این نمونه، تقریب مونت کارلو را برای مقدارد دقیق داریم:

> set.seed(123)
> gamma(3.5)
[1] 3.323351
> mean(rexp(n=1000)^2.5);
[1] 3.41193
> mean(rexp(n=10000)^2.5);
[1] 3.320106

↧

آموزش رایگان آمار در سطوح لیسانس و فوق لیسانس

December 2, 2014, 1:37 pm

≫ Next: آموزش رایگان نرم افزارهای آماری SPSS-Minitab-R-SPLUS

≪ Previous: محاسبه تابع گاما با استفاده از شبیه سازی مونت کارلو

بدینوسیله به اطلاع می رساند حداکثر در یک جلسه دو ساعته و به صورت رایگان، آموزش مورد نیاز را برای دروس آماری سطوح کارشناسی و کارشناسی ارشد رشته های آماری و غیر آماری را ارایه می کنیم. در همین راستا لازم است به جهت بهره برداری بیشتر از کلاس هماهنگی دو هفته قبل صورت پذیرد. همچنین به اطلاع می رساند در صورت نیاز آمادگی ارایه مختصری از چند نرم افزار نیز در یک جلسه وجود دارد

توجه:

** این اقدام تا پایان سال 93 انجام می پذیرد**

** حداقل تعداد جهت تشکیل یک کلاس 2 نفر می باشد، و امکان درخواست همزمان چند نفر وجود دارد***
*** ترجیحا کلاس های در محل تدریس بنده صورت می پذیرد و درخواست دیگر نیز قابل بررسی می باشد***

درخواست های خود را به آدرس ntazikeh@gmail.com ارسال نمایید تا اقدام لازم جهت هماهنگی صورت پذیرد.

با بهترین آرزوها-تازیکه

09300023999

↧

آموزش رایگان نرم افزارهای آماری SPSS-Minitab-R-SPLUS

December 3, 2014, 1:34 pm

≫ Next: تدریس/آموزش نرم افزارهای آماری SPSS، R، Minitab، SAS و ...

≪ Previous: آموزش رایگان آمار در سطوح لیسانس و فوق لیسانس

بدینوسیله به اطلاع می رساند حداکثر در یک جلسه دو ساعته و به صورت رایگان، آموزش مورد نیاز را برای نرم افزارهای آماری SPSS-Minitab-R-SPLUS را ارایه می کنیم.
مزید اطلاع می باشد لازم است به جهت بهره برداری بیشتر از کلاس هماهنگی دو هفته قبل صورت پذیرد
همچنین به اطلاع می رساند در صورت نیاز آمادگی ارایه مختصری از چند نرم افزار نیز در یک جلسه وجود دارد
توجه:

*** این اقدام تا پایان سال 93 انجام می پذیرد**
** حداقل تعداد جهت تشکیل یک کلاس 4 نفر می باشد، و امکان درخواست همزمان چند نفر وجود دارد***
*** ترجیحا کلاس های در محل تدریس بنده صورت می پذیرد و درخواست دیگر نیز قابل بررسی می باشد***

درخواست های خود را به آدرس ntazikeh@gmail.com ارسال نمایید تا اقدام لازم جهت هماهنگی صورت پذیرد.

با بهترین آرزوها-تازیکه

09300023999

↧

تدریس/آموزش نرم افزارهای آماری SPSS، R، Minitab، SAS و ...

December 4, 2014, 12:39 pm

≫ Next: مولفه های بیمه غیر عمر

≪ Previous: آموزش رایگان نرم افزارهای آماری SPSS-Minitab-R-SPLUS

با سلام و احترام

بدینوسیله به اطلاع متقاضیان آموزش نرم افزارهای آماری SPSS، R، Minitab، SAS و ... می رساند مدرسین خبره و مجرب که سالها تجربه کار عملی و آموزشی دارند نسبت به تدریس خصوصی مبتنی بر نیاز فراگیران اقدام نموده اند. لذا هر گونه تقاضایی در این زمینه قابل بررسی و پاسخگویی می باشد.

با توجه به اختصاصی بودن آموزش ها، سرفصل، زمان برگزاری، سرعت پیشروی و .. به درخواست فراگیر بوده و پس از دوره ها نیز تیم آموزش دهنده ملزم به پاسخگویی با شرایط خاص می باشد.

مبنای محاسبه شهریه دوره های نرم افزاری به شرح حدول زیر اعلام می گردد:

حدول شهریه دوره های آموزش نرم افزاری(سال 93)
ردیف	محل برگزاری	حداقلشهریه دوره (به ازای هر ساعت/تومان)				توضیحات
ردیف	محل برگزاری	انفرادی	2 نفره	3 یا 4 نفره	بالای 4نفر	توضیحات
1	در محل مدرس(بدون رایانه)	35.000	45.000	55.000	-
2	در محل مدرس(با رایانه)	40.000	55.000	65.000	-
3	در محل فراگیر	50.000	55.000	65.000	75.000
توضیحات: دانشجویان دانشگاه های دولتی در تمامی موارد شامل حداقل شهریه می شوند. بعد از دوره های فوق الاشاره، چند پروژه ی نمونه در اختیار فراگیر قرار خواهد گرفت. بعد از دوره، در صورت تایید مدرسین ، فراگیران برتر در فهرست همکاران جهت انجام پروژه قرار خواهند گرفت. مبرهن است که آموزشهای مازاد به صورت رایگان توسط مدرسین انجام خواهد گرفت و تعهد لازم نیز از فراگیر اخد می گردد. محدودیت در انتخاب سرفصل وجود نداشته و دسته بندی خاصی (مقدماتی یا پیشرفته) و اخذ هزینه اضافی وجود ندارد.

فراگیران محترم می توانند جهت کسب اطلاعات بیشتر از طریق ایمیل های زیر اقدام نمایند و در صورت نیاز، ضمن درج شماره تماس خود در پیام ارسالی، منتظر تماس از طرف ما باشند.

ntazikeh@gmail.com

tazikeh_nm@yahoo.com

همچنین به اطلاع می رساند ضمن ثبت نام در خبرنامه، از دوره های رایگان آموزش نرم افزاری برخوردار شوید.

با تشکر

تازیکه

09300023999

↧

مولفه های بیمه غیر عمر

December 26, 2014, 2:06 pm

≫ Next: داده های آماری

≪ Previous: تدریس/آموزش نرم افزارهای آماری SPSS، R، Minitab، SAS و ...

با نام و یاد خدای مهربان

فرآیند ادعا در بیمه های غیر عمر متشکل از دو مولفه می باشد: فراوانی ادعا و شدت ادعا، به طوری که حاصلضرب امید ریاضی نرخ ادعا و امید ریاضی شدت ادعا حق بیمه خالص یا مخاطره ای را تعریف می کند.

امروزه برای مدل بندی این مولفه ها از پتانسیل بالای GLM ها در استفاده از کوواریت ها استفاده می شود (ARTHUR E. RENSHAW(1994) austin bulletin)و همچنین برای بررسی وابستگی و در صورت وجود مدل بندی آن از توابع مفصل.

با استفاده از مدلهای تعمیم یافته خطی می توان تواما حضور متغیرهای پیوسته، گسسته و یا ترکیبی از آنها را در مدل بندی استفاده نمود.

↧

داده های آماری

June 25, 2015, 3:50 am

≫ Next: پروژه تحلیلی 101

≪ Previous: مولفه های بیمه غیر عمر

با سلام

بسیار در پی داده های واقعی جهت تحلیل های آماری خود هستیم و بدون هدف به جاهای مختلفی فکر میکنیم.

برای چنین منظوری چند محل سهل الوصول برای دسترسی به داده ها وجود دارد:

1- نرم افزارهای آماری: در تمامی نرم افزارهای آماری که امکان آموزش و راهنمایی در آنها تعبیه شده است (SPSS، R و ...) مجموعه داده ها ی واقعی زیادی وجود دارد که به سادگی قابل دسترسی هستند.

2- پایگاههای داده رایگان: وب سایت های گوناگونی داده هایی را تمرین پروژه های کلاسی و دانشگاهی ارائه نموده اند که در اینترنت به سادگی قابل دسترسی هستند به عنوان مثال تعدادی از آنها عبارتند از:

3- سایت های با حوزه های تخصصی در سری زمانی (لینک 1، لینک 2، لینک 3 ...)،

4-مراجعه با شرکت ها و نهادهای دارای پایگاه داده مانند سازمان هواشناسی

امید است با تکمیل و ثبت ایرادات این پست، شما هم به محققین و دانشجویان عزیز کمک و همیاری نمایید.

↧

پروژه تحلیلی 101

July 7, 2015, 12:57 pm

≫ Next: پروژه تحلیلی 102

≪ Previous: داده های آماری

در ادامه مطلب، تحلیلی شامل "بررسی تاثیر دو متغیر سن و جنس بر زمان عکس العمل از طریق نرم افزار spss"را به عنوان یک پروژه آماری سطح متوسط میتوانید دانلود کنید.

به همین منوال در روزهای آتی به پروژه های دیگر بارگذاری خواهد شد امید است شما نیز با در اختیار گذاشتن پروژه خود جهت درج در وبلاگ، ما در این امر یاری کنید.

↧