نرم افزار استتا

sajad 3000

کاربر فعال تالار اقتصاد ,
کاربر ممتاز
کلیات نرم افزار
استتا یا Stata یک برنامه آماری چند منظوره است که اولین نسخه آن در سال 1985 عرضه شد. این برنامه بین دانشگاهیان و موسسه‌های آکادمیک سراسر دنیا کاربرد فراوان دارد. اکثر کاربران این نرم‌افزار محققینی می‌باشند که در رشته‌های اقتصاد، جامعه شناسی، علوم سیاسی و شاخه‌هایی از علوم پزشکی مشغول به پژوهش و تحقیق می‌باشند.​
از جمله قابلیت‌های آن می‌توان به مدیریت داده‌ها، تجزیه تحلیل آماری، ترسیم نمودار، شبیه سازی و برنامه نویسی به صورت دلخواه اشاره نمود.​
کلمه Stata ترکیبی از دو کلمه Statistics و Data می‌باشد و تلفظ آن معمولا به شکل خاصی نمی‌باشد و به هر سه صورت (stay-ta), (sta-ta), (stah-ta) قابل تلفظ است.​
هر نسخه این نرم‌افزار معمولا در چهار گروه زیر عرضه می‌شود:​
Stata/MP : برای کامپیوترها با پردازشگر چند هسته‌ای​
Stata/SE : برای پایگاه‌های داده بزرگ​
Stata/IC : ورژن استاندارد نرم‌افزار​
Small Stata : نسخه سبکتر مخصوص دانشجویان​
رابط کاربری نرم‌افزار
استتا اغلب روی یک رابط نوشتاری که دستورها را باید در قالب متن برای اجرا در نرم‌افزار نوشت تاکید می‌کند چرا که اعتقاد دارد این روش باعث افزایش سرعت می‌شود. با این حال از نسخه 8 نرم افزار به به بعد یک واسط گرافیکی به شکل منوی افقی در بالای نرم‌افزار در دسترس می‌باشد که بعد از کلیک روی عملیات مورد نظر یک جعبه تبادل دوطرفه برای اجرای دستور ظاهر شده که شما را برای اجرای دستور راهنمایی می‌کند. خصوصیت خوب نرم‌افزار این است که پس از اجرای دستور از طریق رابط گرافیکی، دستور نوشتاری آن نیز نمایش داده‌ می‌شود تا کاربر با فراگرفتن آن بتواند در مرحله بعدی کار را با سرعت بیشتری انجام دهد. دستورهایی که از قبل اجرا شدند را نیز با یک کلیک ساده روی پنجره دستورات میتوان دوباره اجرا کرد. همچنین با ساخت یک Dofile می‌توانید تمامی دستورات مورد نظر را به یکباره اجرا نمایید.​
داده‌ها در استتا:
نرم‌افزار استتا تنها می‌تواند یک مجموعه داده را در یک زمان باز نماید اما این خللی در انجام کار محققین ایجاد نمی‌کند. داده‌ها در این نرم افزار به صورت صفحه گسترده (Spreadsheet) می‌باشد که همانند اکسل بوده و می‌توان داده‌ها را از اکسل به راحتی در آن کپی و پیست نمود. این ویژگی یکی از حسن‌های نرم‌افزار است که کار با آن را ساده‌تر میکند. همچنین داده‌ها با فرمتASC2 را میتوان به راحتی از قسمت Import باز کرد.​
فرمت داده‌های استتا در طول زمان همراه با ورژن‌های جدیدتر متفاوت بوده به نحوی که فرمتهای قدیم در برنامه‌های جدیدتر قابل اجرا بوده اما فرمتهای جدید روی ورژنهای قدیم نرم‌افزار قابل اجرا نیست که می‌توان با استفاده از دستور “saveold” داده‌ها را در ورژن جدید برای استفاده در ورژنهای قدیمی ذخیره نمود.​
بخش راهنما:
بخش راهنما یا همان Help نرم افزار کمک بسیار زیادی را در رابطه با اجرای یک دستور می‌کند. در این بخش هر کلید واژه‌ای را سرچ نمایید می‌توانید راجع به چگونگی اجرای دستور مربوط و اختیارات آن مطالب و دستورالعملهایی با ذکر مثال بیابید. راحتی و گستره بخش راهنمای این نرم‌افزار یکی از ویژگیهای اساسی آن می‌باشد.​


پسورد: www.bfec.ir
 

sajad 3000

کاربر فعال تالار اقتصاد ,
کاربر ممتاز
آموزش نرم افزار

آموزش نرم افزار

مقدمه

رابط کاربری

ایجاد log

وارد کردن داده ها

ایجاد و یا تغییر یک متغیر جدید

مشاهده داده‌ها

برخی دستورات کاربردی

مقادیر مفقوده یا مشاهدات پرت

آموزش تخصصی نرم افزار stata
1. مقدمه

نرم افزار STATA ابزاری قدرتمند در اقتصاد سنجی کاربردی است که به سادگی و با کارآمدی بالایی می تواند در کارکردن با انواع داده ها اعم از داده های مقطعی، سری های زمانی و ترکیبی به دانشجویان و محققین کمک کند. این نرم افزار ابزارهایی را در اختیار کاربر قرار می دهد که داده ها را سازماندهی و مدیریت کرده و شاخص ها را محاسبه و نتایج را تحلیل کند.

دانستن بعضی از وجوه تمایز این نرم افزار امکان استفاده موثر تر و کاراتری را فراهم خواهد کرد. در ادامه به اختصار به برخی از این ویژگی ها اشاره می کنیم:

· سادگي كاربرد: يكي از مهمترين ويژگيهاي STATA سادگی يادگيري دستورهای آن. حتی در صورت عدم اطلاع از ساختار آن مي باشد. STATA تقریباً برای همه دستورها کادر های محاوره ای دارد و هنگامی که یک دستور را از یک کادر محاوره ای اجرا می کنید، می توانید ساختار فرمان را در پنجره review مشاهده کنید و از آن پس می توانید به جای استفاده از کادر محاوره ای، از نوشتن فرمان کمک بگیرید. برای اجرای مجدد یا تغییر و اجرای مجدد آن، می توانید از دستوری که قبلاً اجرا شده است و در پنجره review مشاهده می شود، استفاده کنید.

· امكان تکرار دستورها: یکی از وجوه تمایز نرم افزار STATA توانایی تکرار یک مجموعه از مراحل روی مجموعه ای از متغیرهاست. فرمان هایی مثل for value، for each و macro به کاربر کمک می کنند که یک مجموعه از دستورها (تبدیل، تخمین، ایجاد و رسم نمودار) را برای مجموعه ای از متغیرها تکرار کند که استفاده از آن موجب صرفه جویی در زمان و نوشتن و اجرای دستورها برای تک تک متغیرها خواهد شد. فرمان By Group این امکان را فراهم می کند که یک یا چند متغیر طبقه بندی شده (categorical) تعریف کرده و سپس عملیات پیچیده ای را روی داده ها با دستورهایی کوتاه و ساده اجرا کنید.

· به روز رساني: شما می توانید مشکلات STATA را با به روز رسانی از طریق اینترنت رفع کنید. اتصال به شبکه اینترنت و اجرای برنامه ها وdo-file های (رایگان) به روز رسانی دوره ای، امکان استفاده از برنامه ها و قابلیت های جدید STATA را فراهم می کند. همچنين، انجمن کاربران STATA ضمائم مفیدی را در اختیار کلیه کاربران قرار می دهد.

علاوه بر اينها؛ راهبردهای توسعه STATA، برای کاربران ابزارهای مکملی ارائه می کند که توسط برنامه نویسان ماهر تهیه شده است. اغلب برنامه های نوشته شده توسط کاربران در بایگانی SSC که در دانشگاه بوستون نگهداری می شود، وجود دارد که شما می توانید با استفاده از دستور SSC به آنها دسترسی داشته باشید. برای این کار می توانید از یک صفحه وب برای جستجوی SSC و دانلود برنامه ها استفاده نمایید. نوشتن "whatsnew?" درSSC ضمائم اخیر را فهرست می کند.

· سازگار با سیستم های عامل: برخلاف بسیاری از بسته های آماری مجموعه ویژگی های STATA در میان سیستم عامل های مختلف مانند Linux، Unix، Windows تفاوت ندارد. Do-fileای که روی یک سیستم عامل ایجاد می شود، روی سیستم عامل دیگر نیز نصب و اجرا می شود. این سازگاری این امکان را فراهم می کند که داده های binary یعنی فایل های STATA که داده هایی با پسوند .dta هستند، در هر نرم افزار دیگری مشابه استتا می تواند وارد و خوانده شود.


2. رابط کاربری

برای باز کردن STATA از طریق ویندوز، روی آیکون STATA روی دسک تاپ دوبار کلیک کنید. هنگامی که STATA باز می شود میزکار به نمایش در می‌آید که شامل چهار پنجره view، command، result، variableاست.

Review: فرمان های اجرا شده (درست یا نادرست) در این پنجره ظاهر می شود.

Result: نتایج حاصله از اجرای فرمان ها در این قسمت نمایش داده می شوند.

Variable: فهرست متغیرها، نوع و برچسب آن ها در این پنجره نشان داده می شوند.

Command: فرمان ها در این قسمت نوشته می شوند.

این میز کار که کاربر با آن مواجه است یکی از امتیازات استتا است. با وجود چنین میز کاری همه چیز در کنترل و تحت نظر کاربر قرار دارد.

منوهای اصلی STATA شامل data، statistics، graphic است که دسترسی به بسیاری از فرمانها را فراهم می نماید. منوی data مربوط به مدیریت داده ها است. منوی statistics دسترسی به بسیاری از تخمین ها و آزمون های لازم و منوی graphic امکان ترسیم نمودار را فراهم می سازد. سایر منوها شامل file، edit، user، window، help می باشد که هر یک امکاناتی را در اختیار کاربر قرار می دهد.

از این رو برای انجام عملیات در نرم افزار، می توان از نوشتن فرمان در پنجره command بهره جست و یا از کادر محاوره ای ساخت فرمان مورد نظر استفاده نمود. برای دسترسی به کادر محاوره ای از از منوهای فوق الذکر، نوشتن db commandname و یا سیستم help می توان استفاده کرد. به عنوان مثال دستور db reg کادر محاوره ای رگرسیون دادههای مقطعی را باز می کند. همچنین هنگام استفاده از سیستم help، برای دسترسی سریع به کادر محاوره ای در گوشه سمت راست و بالای پنجره help، گزینه dialog box تعبیه شده است که با کلیک نمودن روی آن وارد کادر محاوره ای می شوید.

در اغلب کادر های محاوره ای 5 کلید دیده می شود: Cancel، ok، submit، ؟ ، R.

Ok: از کادر محاوره ای خارج شده و فرمان داده شده را بر اساس اینکه کادرهای موجود در این کادر را چگونه تکمیل نموده اید، اجرا می نماید.

Cancel: از کادر محاوره ای بدون انجام هیچ کاری خارج می شود.

Submit: همانند Ok فرمان را اجرا می کند اما کادر محاوره ای را باقی می گذارد تا در صورت لزوم تغییراتی اعمال نموده ومجدداً فرمان را اجرا کنید.

؟: امکان دسترسی به help در STATA را فراهم می کند.

R: مخفف کلمه “reset” است. زمانی که کادر محاوره ای باز می شود، آخرین تغییرات اعمال شده در هر یک از قسمت های آن را نشان می دهد که با فشردن کلید R به وضعیت پیش فرض در استتا تغییر می کند.

نوار ابزار امکان دیگری هستند که در میز کار STATA تعبیه شده اند. نوار ابزار شامل کلیدهایی است که دسترسی سریع به آن دسته از امکانات STATA که بیشتر مورد استفاده می باشد را فراهم می نماید. با نگهداشتن اشاره گر موس بر روی هر یک از این کلیدها می توانید نام آن را بخوانید. نوار ابزار شامل کلیدهای زیر است:

Open: بازکردن فایل داده ها

Save: ذخیره کردن فایلها

Print: چاپ کردن اطلاعات

Log: شروع یک logجدید برای ثبت عملیات

Viewer: پنجره viewer را باز می کند یا آن را جلوی پنجره result قرار می دهد.

Bring result to front: پنجره result راجلوی پنجره های دیگر قرار می دهد.

Bring graph to front: پنجره graph را جلوی پنجره های دیگر قرار می دهد.

New do file editor: پنجره do-file editor را باز می کند یا آن را جلوی پنجره های دیگر قرار می دهد.

Data editor: پنجره مربوط به داده ها را نشان می دهد و امکان ویرایش آن را فراهم می کند.

Data browser: پنجره مربوط به داده ها را باز می کند وامکان مشاهده داده ها را فراهم می سازد.

clear-more-condition: زمانی که نتایج طولانی است، STATA پس از ارائه قسمتی از نتایج متوقف می شود. این کلید از STATA می خواهد که به کار ادامه دهد و نتایج را ارائه کند.

Break: سبب توقف اجرای فرمان یا ارائه نتایج طولانی می گردد.


3. ایجاد log

نتیجه دستورهای اجرا شده در استتا در پنجره خروجی نمایش داده می شود. اما خروجی های نرم افزار ذخیره نمی شود. ذخیره کردن خروجی ها مرور نتایج را در زمان دیگر بدون اجرای مجدد فرمان ها امکان پذیر می سازد. مزیت دیگر ذخیره کردن خروجی ها، این است که ممکن است از خواندن خروجی های طولانی در نرم افزار دچار مشکلاتی شوید. از این رو با ایجاد یک پرونده جانبی می توان نه تنها خروجی ها بلکه فرمان های اجرا شده را ذخیره نمود.

کلیه خروجی های نرم افزار را با کمک ایجاد یک پرونده جانبی به نام "log" می توان ذخیره نمود. با ایجاد این پرونده کلیه عملیات شامل دستورهای اجرا شده (درست یا نادرست) و نتایج نرم افزار به طور خودکار ثبت می شود. این پرونده به طور پیش فرض با پسوند .log ذخیره می شود. اما می توان آن را با پسوند .txt یا .smcl ذخیره نمود(smcl کلیه عملیات ذخیره شده را به همان شکلی که در پنجره نتایج مشاهده می شود، نگهداری می کند).

برای ایجاد یک فایل log می توان از دستور

log using filename

استفاده نمود. برای این کار پس از نوشتن "log using" نام و مسیر مورد نظر برای ذخیره پرونده log نوشته می شود. به عنوان مثال log using e:\stata\log_1.txt یک پرونده log در درایو e و پوشه stata ایجاد و به طور متنی ذخیره می کند. وقتی انجام محاسبات مورد نظر پایان یابد با دستور "log close" پرونده log فعال بسته شده و عملیاتی که پس از این دستور انجام می شود، در آن ذخیره نمی شود.

در صورتیکه بدون اجرای دستور اجرای log close از نرم افزار خارج شوید، فایل log به طور خودکار بسته می شود.

برای ایجاد و یا استفاده از پرونده log ای که قبلاً ذخیره شده است، می توانید از مسیر file<log<begin استفاده کنید، در این صورت در پنجره ای که باز می شود، مسیر پرونده log مورد نظر برای ذخیره log را تعیین کرده وبا کلید ok تأیید کنید.

: موقتاً ثبت نتایج را به تعویق می اندازد که معادل با نوشتن دستور log off است.

File<log<resume: فایل log را که قبلاً ذخیره شده است، رافعال می کند که معادل دستور log on است.

File<log<view: فایل log فعال شده در قسمت viewer مشاهده می شود.


4.وارد کردن داده ها

شما به راحتی میتوانید داده های خود را از برنامه اکسل در قسمت Dtata editor کپی نمایید و تغیرات لازمه را در آن قسمت اعمال نمایید.


5. ایجاد و یا تغییر یک متغیر جدید

برای ایجاد ویا تغییر یک متغیر دستورهای اساسی در STATA ارائه شده است. این سه فرمان مشابه هستند اما تفاوت های مهمی دارند.



Gen

دستور generate یا gen متغیری جدید که نام آن در داده ها وجود ندارد، را با استفاده از عبارات، توابع و عملگرها ایجاد می کند.

generate [type] newvar[:lblname] =exp [if] [in]

هنگام ایجاد یک متغیر جدید باید نام متغیر و رابطه ای که بر اساس آن ایجاد می شود، مشخص شود. علاوه بر این می توان نوع ذخیره سازی متغیر جدید را تعیین نموده و از فرمان هایی مانند if و in در صورت لزوم استفاده نمود.



replace

دستور replace برای جایگزین کردن و تغییر دادن بعضی یا همه مقادیر متغیری که در داده ها وجود دارد، استفاده می شود.

replace oldvar =exp [if] [in]



if exp ، in range

به طور پیش فرض دستورها در STATA روی تمام داده ها اجرا می شود. به کمک if و in می توان یک فرمان را روی زیر مجموعه ای از داده ها که شامل شرایط و دامنه خاصی از مشاهدات هستند، اجرا نمود. تقریباً در تمام فرمان های استتا امکان ترکیب با in و if وجود دارد و در تمام پنجره های محاوره ای مشاهده می شود.


6. مشاهده داده‌ها

برای مشاهده داده ها می توان علاوه بر پنجره data editor از نوار ابزار، از سه دستور list، tabulate و summarize استفاده کرد. دستور list تمام مشاهدات و متغیرهای موجود را نشان می دهد اما می توان تنها بعضی از آن ها و یا دامنه خاصی را انتخاب نمود. برای این کار کافی است پس از دستور list نام متغیر و دامنه دلخواه را مشخص کنید.

list [varlist] [if] [in]

توجه داشته باشید که درصورتی که برای متغیر برچسب تعریف شده باشد، به جای نام متغیر، برچسب آن نشان داده می شود. مثال



این فرمان از مسیر data<describe data<list data قابل دسترسی است.

دستور tabulate یا tab هر یک از مقادیر موجود در متغیر مورد نظر، فراوانی، درصد فراوانی و درصد فراوانی تجمعی آن را مشخص می کند.

tabulate varname1 [if] [in] [weight]



دستور summarize یا sum آماره های توصیفی برای یک متغیر دلخواه یا تمام متغیرها را در یک جدول نشان می دهد.

summarize [varlist] [if] [in] [weight]

این فرمان از مسیر data<describe data<summary statistics در دسترس کاربر قرار گرفته است.


7. برخی دستورات کاربردی

i. describe

هنگام شروع کار با یک مجموعه داده معین، ابتدا به مشاهده ویژگی متغیرها پرداخته می شود. دستور describe خلاصه ای از مشخصات متغیرهای مجموعه داده های موجود در حافظه استتا و یا ذخیره شده در مسیر مشخصی را برای برخی یا تمام متغیرها لیست می کند. این دستور بدون لیست کردن مشاهدات، اطلاعاتی در خصوص نوع ذخیره سازی متغیر، برچسب مشاهدات و برچسب متغیرها و .. را نشان می دهد.

ساختار این فرمان به شکل زیر است

describe [varlist] using filename

در ساختار فوق لازم است به جای varlist نام متغیرهای مورد نظر (در صورتی که کاربر مایل نباشید تمام متغیرها را مورد بررسی قراردهد) و به جای filename مسیر و نام مجموعه داده ای که مورد نظر کاربر است (در صورتی که داده های موجود در حافظه استتا مورد نظر نباشد)، نوشته می شود.

دسترسی به این فرمان از مسیر data<describe data< describe data in memory و همچنین data<describe data< describe data in file امکان پذیر است.

فرمان های مشابه دیگری نیز برای مطالعه ویژگی های متغیرها وجود دارند که از آن جمله می توان به فرمان codebook اشاره کرد که مشابه فرمان فوق است با این تفاوت که اطلاعات بیشتری از متغیر به دست می دهد. در فصل های بعد به مرور با این فرمان ها آشنا خواهید شد.

ii. set memory

بعضی از مجموعه داده ها بزرگ هستند و در استتا نیاز به حافظه بیشتر خواهد بود. در این موارد لازم است که حافظه بیشتری نسبت به پیش فرض تنظیم شود. برای بالا بردن حافظه از فرمان

set memory #[b|k|m|g]

استفاده می شود. برای مثال اگر حافظه لازم برای باز کردن یک مجموعه داده 100مگا بایت است، در پنجره فرمان بنویسید:

set mem 100m

در این صورت حافظه پیش فرض به 100مگابایت ارتقاء می یابد.

iii. rename

از این فرمان می توان برای تغییر نام متغیرها استفاده نمود. برای این کار می توان روی نام متغیر در پنجره variable راست کلیک کرده و گزینه rename را انتخاب نمود و یا با نوشتن فرمان نام متغیر را تغییر داد. برای این کار پس از دستور rename ابتدا نام فعلی متغیر و سپس نام مورد نظر نوشته می شود.

rename old_varname new_varname

این فرمان از مسیر data<variable utilities<rename variable در اختیار کاربر قرار می گیرد.

iv. note

از دستور note می توان برای اضافه کردن یک یادداشت توضیحی برای مجموعه داده ها و یا هر یک از متغیرها استفاده کرد.

ساختار این فرمان برای افزودن یک یادداشت توضیحی برای متغیر به شکل زیر است:

notes [varname]: text

برای نوشتن یک یادداشت توضیحی برای مجموعه داده کافی است نام متغیر نوشته نشود.

notes : text

دسترسی به این فرمان از مسیر data<note<add notes امکان پذیر است.

v. label

به منظور محقق برای درک بهتر داده های موجود، می توان برای مجموعه داده، هر یک از متغیرها و مشاهدات یک متغیر برچسب یا label تعریف نمود. برای تعریف label برای یک مجموعه داده می توانید از فرمان زیر استفاده کنید:

label data ["label"]

برای تعریف برچسب برای یک متغیر می توانید روی متغیر مورد نظر راست کلیک کرده و گزینه label را انتخاب کنید و در پنجره ای که باز می شود، برچسب مورد نظر را بنویسید و یا از فرمان زیر استفاده کنید:

label variable varname ["label"]

برای تعریف برچسب برای مقادیر یک متغیر ابتدا باید برچسب مورد نیاز برای هر یک از مقادیر را با استفاده از فرمان زیر تعریف کنید:

label define lblname # "label" [# "label". ..]

و سپس برچسب تعریف شده را به متغیر مورد نظر نسبت دهید.

label values varname [lblname]

برای مثال اگر داده ها شامل جنسیت بوده و جنسیت مذکر با عدد 1 و مونت با عدد 2 نشان داده شده باشد، ترجیح می دهیم که خروجی مقادیر متغیر، به جای اعداد 1 و 2، male و female باشد، در این صورت دستور label امکان برچسب گذاری را فراهم می کند.

دسترسی به هر یک از فرمان های فوق از مسیر data<label و گزینه های label dataset، label variable و label value امکان پذیر است.
8. مقادیر مفقوده یا مشاهدات پرت

نرم افزارSTATA انواع مختلفی از مقادیر مفقوده عددی را که می تواند به دلیل فقدان داده تصریح شود، پشتیبانی می کند. اغلب اوقات داده مفقوده به شکل "." شناخته می شود که زمانی که مقداری برای یک متغیر تعریف نشده باشد، توسط STATA ایجاد می شود. بسط مقادیر مفقوده به 26 شکل دیگر((.a, .b, …. , .z نیز امکان پذیر است که در صورت لزوم توسط کاربر برای ردیابی مقادیر مفقوده با دقت تعریف می شود. مقادیر مفقوده عددی به اعداد مثبت بزرگ تعبیر می شود. بدان معنا که هنگام مرتب سازی داده ها مقادیر مفقوده به عنوان بزرگترین داده ها شناسایی می شود.

به طور پیش فرض استتا تمام مقادیر مفقوده را هنگام انجام دستورها و محاسبات حذف می کند به عبارت دیگر اعمال هر تابعی روی مقادیر مفقوده مجدداً داده مفقوده ایجاد می کند. برای مثال اجرای دستورهای محاسبات آماری روی یک متغیر (مانندsum,tab و ...) تنها مشاهدات موجود (غیرمفقوده) را در نظر گرفته و محاسبات را انجام می دهد. و یا هنگام اجرای یک رگرسیون روی مجموعه داده ها، تمام مشاهدات متغیرهای وابسته و مستقل که شامل مقادیر مفقوده است، حذف شده و رگرسیون روی مقادیر موجود تخمین زده می شود.
 

Similar threads

بالا