<머리말>
 오늘날 정보통신의 발달과 사회가 고도로 전문화 분업화 되면서 이를 둘러싼 사회현상도 복잡화되고 있다. 정책의 효율성을 높이고 합리적인 사회문제해결을 위한 사회과학 모형의 역할 역시 고도의 전문성을 필요로 하고 있다. 이런 측면에서 사회과학 통계론은 과학적 방법으로 사회과학현상에 대한 이해와 실증분석을 통한 예측능력을 높이는 지식을 제공하게 될 것이다. 통계학적 지식의 중요성이 증대되면서 많은 대학에서 통계론 관련강의를 개설하고 있지만, 이를 이해하고 사회현상에 접목하기란 좀처럼 쉬운 일이 아니다. 따라서 본 저서는 통계학 비전공자를 대상으로 복잡한 이론보다 기초적인 통계학적 지식을 통해 사회현상을 관찰, 분석, 기술하고 이를 기초로 추론해 나가는데 초점을 두었다. 즉, 사회과학 통계의 간략한 이론과 분석 방법 등을 실용적 측면에서 집필 하였다.
 통계학 교재들은 수없이 많이 나와 있다. 시중에 많은 좋은 서적들이 나와 있음은 주지의 사실이다. 그럼에도 불구하고 R을 이용한 사회과학 통계론 관련 서적들은 매우 드문 것으로 알고 있다. 따라서 이 책을 집필하는 데는 나름대로 몇 가지 중요한 이유가 있었다.
 먼저 R의 최대 장점은 free software program이라는 점이다. 즉 오픈소스(open-source)로서 언제든지 http://www.r-project.org 사이트에서 다운을 받아 설치할 수 있다. 이미 우리가 피부로 느끼고 있듯이 시중에 또는 학교에서 사용되는 통계 패키지들은 개인이 구입하기에는 상당히 고가의 제품으로 학교나 직장 외에서 개인이 자유롭게 사용하기는 쉽지 않다. 이러한 현상은 개인 불법 복제품의 단속 강화와 더불어 저작권법의 강화에 따라 점점 더 우리의 연구 및 분석 작업을 어렵게 만들 것으로 예상된다.
 다음으로 R 프로그램은 확장성이 다양하다는 장점이 있다. 즉 전문화된 package들이 내용이 질적 양적으로 급속도로 확산되고 있다는 것이다. 2002년 100여개 정도에 불과 하였으나 2012년에는 이미 R 프로그램 내에 2,500개 이상의 패키지들(packages)이 있고, 2018 현재 12,000개 이상의 패키지들(packages)이 사용가능하게 구성되어 있다. 이는 특화된 기능을 분석하는 전문화된 작은 소프트웨어 프로그램이 12,000여개 이상 되며, 예를 들어, car(Companion to Applied Regression) package는 사회과학에서 자주 이용되는 다양한 회귀분석 전문 package이며, spdep(spatial dependence) package는 공간계량모형에 자주 이용되는 전문 package이다. 다시 말해, 이미 시중에 나와 있는 대부분의 고가 소프트웨어 통계분석작업이 R에서도 가능할 뿐만 아니라 어떤 면에서는 특화된 package를 통하여 더욱더 심도 있는 분석 작업이 가능하다고 하겠다. 다행스러운 것은 우리가 12,000개가 넘는 전문화된 package들을 다 알 수도 없고 다 알 필요도 없다는 것이다. 실제로 우리는 이미 초기에 R을 구동하면 base package가 자동적으로 탑재되는데 이 base package만으로도 우리가 분석할 수 있는 대부분의 통계 분석방법들이 특별한 어려움 없이 충분히 해결할 수 있다는 것을 의미한다. 본 책자에서도 이용된 package들도 30개 내외에 불과하다.
 이와 같이, 구입비용이 전혀 들지 않는 훌륭한 free software와 탄탄한 구성과 기능, 다양한 통계분석이 가능한 무한한 확장성과 더불어 R의 장점은 무수히 많아 아무리 강조해도 지나침이 없겠다.
 마지막으로, 본 저서는 사회과학 통계 관련 분야의 이론들에 대하여 심도 있게 설명하기 보다는 실제의 자료 또는 가상자료를 통하여 다양한 통계적 분석방법을 적용하여 결과를 얻고 해석하는데 주안점을 두고 있다. 다시 말해 practitioner 관점에서 집필되었다. 아무튼 R을 이용하여 나름대로 최대한 쉽게 설명하려고 최선을 다해 노력하였다. 그럼에도 불구하고 본 책자에서 발견되는 수많은 흠집과 오류들은 전적으로 저자들의 잘못이며 이러한 점들은 꾸준히 수정 보완해 나아갈 것을 약속드린다.
 이 책이 출판되기까지 물심 양면으로 도움을 주신 도서출판 윤성사 정재훈 대표님과 임직원 여러분께 깊은 감사의 말씀을 전한다. 그리고 취업준비에 바쁜 와중에도 고생한 부경대학교 행정학과 최우혁 군과 금동호 군에게도 심심한 감사의 말을 전한다. 
 끝으로 이 책에서 사용된 자료들과 R 프로그램 명령어(commander), Rstudio 명령화면 캡쳐, R Studio notebook을 이용한 명령어 및 결과를 한번에 볼 수 있는 html파일, 본서에 이용된 자료 들을 윤성사 홈페이지(www.yspublish.co.kr) 자료실에서 다운받아 볼 수 있다.
대표저자 정건섭

<차례>
들어가기 R의 설치 및 간단한 예제 연습 13
무작정 따라 하기
제1절 R의 설치 14
 1. R의 배경 및 간단한 소개 14
 2. R 프로그램 설치 15
 3. R 프로그램의 시작 25
 4. 패키지(package) 설치 26
 5. 파일 메뉴 27
 6. 편집 메뉴 27
 7. 기타 메뉴 28
 8. 오브젝트(object) 28
제2절 R 프로그램의 간단한 예제 및 따라하기 31
 1. R 프로그램의 도움말 예제 따라하기 31
 2. 간단한 R 통계 프로그램 예제 따라하기 36
 3. 다양한 R 함수 예제 따라하기 51
 4. 중심극한정리(central limit theorem) 그래프 보기 54
 5. 스크립트(script) 55

제1장 통계학의 기초 및 자료의 수집과 정리 58
제1절 통계학의 필요성과 기초 59
 1. 통계학의 기원 59
 2. 통계와 통계학 61
 3. 통계학의 필요성 62
 4. 의사결정과 통계 63
 5. 통계분석 도구의 활용 64
 6. 통계자료의 기초지식 66
제2절 자료의 수집 69
제3절 자료의 정리 72
 1. 표와 그림에 의한 자료의 정리 73
 2. 수치에 의한 자료의 특성 75
제4절 R 연습 89

제2장 확률과 확률분포 95
제1절 확률과 조건부확률 97
 1. 확률 97
 2. 확률의 덧셈법칙 100
 3. 조건부 확률 102
 4. 조건부 확률의 곱셈법칙 104
 5. 결합 확률과 주변 확률 106
 6. 베이즈 정리 108
제2절 확률변수와 확률분포 110
 1. 확률변수 110
 2. 확률분포 113
 3. 확률분포의 기대값과 분산 114
제3절 주요확률 117
 1. 이항분포 118
 2. 포아송분포 122
 3. 정규분포 124
 4. 표준정규분포 129

제3장 표본추출과 표본분포 132
제1절 표본추출 135
 1. 표본과 모집단 135
 2. 표본과 추출방법 136
 3. 표본오차 140
 4. 모집단의 크기와 표본의 크기 143
제2절 표본분포 144
 1. 표본 통계량과 모수의 관계 144
 2. 표본평균의 분포 146
 3. 표본비율의 분포 149
 4. 두 표본 평균 및 두 표본 비율차의 분포 151
 5. 카이제곱 분포 154
 6. F 분포 155
 7. T 분포 156
제3절 R 연습 157

제4장 통계적 추정 159
제1절 점추정 161
 1. 점추정의 의의 161
 2. 바람직한 점추정량의 조건: 불편성, 효율성, 일치성 162
 3. 바람직한 추정량을 산출하는 방법 167
제2절 구간추정 168
 1. 모평균의 구간추정 169
 2. T 분포를 이용한 모평균의 추정 173
 3. 모비율의 구간추정 176
 4. 모집단의 분산에 대한 구간추정 179

제5장 가설검정 181
제1절 추리통계와 가설검정 183
 1. 추리통계와 가설검정 절차 183
 2. 가설의 설정 185
 3. 가설검정 방법의 선정 187
 4. 가설의 판정 188
 5. 양측검정과 단측검정 192
제2절 가설검정의 오류 195
 1. 제1종 오류와 제2종 오류 195
제3절 Z 및 T-검정 197
 1. z 및 T-검정에 필요한 전제조건 197
 2. z 및 T-검정의 활용 198
 3. 단일표본 T-검정 199
 4. 독립표본 T-검정 202
 5. 대응표본 T-검정 205

제6장 분산분석 210
제1절 분산분석의 개요 212
 1. 분산분석의 활용과 가설의 설정 212
 2. 분산분석의 가정 213
 3. 분산분석의 원리 214
제2절 일원 분산분석에 대한 가설검정 216
제3절 이원 분산분석에 대한 가설검정 227

제7장 비모수검정 231
제1절 비모수검정 232
제2절 카이제곱 검정 234
 1. 동질성 검정 237
 2. 적합도 검정 239
 3. 독립성 검정 243
제3절 기타 비모수적 통계검정 250
 1. Wilcoxon 검정 251
 2. Kuskal-Wallis 검정 255

제8장 상관분석 259
제1절 상관분석의 기초 260
 1. 공분산과 상관계수 260
 2. 상관분석의 요건 및 가정 262
제2절 상관분석의 가설 및 검정 263

제9장 단순회귀분석 267
제1절 회귀분석의 기초 269
제2절 가설의 설정과 회귀모형 272
제3절 단순회귀분석의 이론적 기초 275
 1. 표본 회귀식의 결정 276
 2. 회귀식의 오차항 281
 3. 회귀식의 적합도 282
 4. 회귀식의 선형관계 및 회귀계수에 대한 가설 검정 286
제4절 R을 이용한 단순 회귀분석 287

제10장 다중회귀분석 295
제1절 다중회귀분석 개요 296
제2절 다중회귀분석의 가정 및 이론적 기초 297
 1. 다중공선성의 문제와 해결 300
 2. 수정된 결정계수 301
 3. 표준회귀계수 302
제3절 독립변수의 선택 및 방법 303
제4절 더미변수에 대한 회귀분석 305
제5절 부산시 실거래 주택가격을 이용한 회귀분석 307
제6절 기초자치단체 재정자립도를 이용한 회귀분석 316
제7절 R에 내장된 자료를 이용한 회귀분석 322

부록1 설문 및 코딩자료 335
 1. 취업특성.csv 설문지 336
 2. 지방재정.csv 코딩 참고자료 339
부록2 각종 통계표 340
 1. 이항분포 340
 2. 포아송분포 342
 3. 표준정규분포 344
 4. T-분포 345
 5. F-분포 346
 6. χ2-분포 348

<저자약력>

정건섭
- The University of Texas at Dallas 도시주택 계량정책 전공
- The University of Texas at Dallas  지역개발연구소(Bruton Center) 연구원
- The University of Texas at Dallas 정치경제학 박사
- 인천광역시 정책연구실장
- 한서대학교 행정학과 교수
- 현재 부경대학교 행정학과 교수
[주요 논문]
- Hedonic Models of Housing Prices: A Critical Appraisal of the Assumptions
- The Application of the Efficient Housing Price Estimation with and/or without Heteroskadasticity
- Chow and Wald Tests for Parameter Equality under Conditions of Heteroskadasticity
- The Regional Homogeneity in the Presence of Heteroskadasticity
- R Commander를 이용한 행정통계분석

김성우
- 부산대학교 경영학 석사
- 부경대학교 행정학 박사
- 부경대학교 공공정책 연구소 책임연구원
- 현재 도시주택보증공사 선임연구원
[주요 논문]
- 부산의 주택 하위시장 구분 및 특성에 관한연구
- 그랜저 인과분석을 통한 매매와 전세 시장의 주택가격 결정구조 분석
- 지방정부의 재정 능력에 따른 주민의 사회복지서비스 인식 비교연구
- R Commander를 이용한 행정통계분석