ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 방송통신대 통계데이터학과 전공과목 [2022.12.19]
    -- 방송통신대 -- 2022. 12. 20. 17:16

    2021년 1학기를 시작으로 2022년 2학기까지 2년동안의 방송통신대 통계데이터학과의

    마지막시험을 지난 주에 마감하였다.

    대학원 진학은 안하고  2년간 배웠던 과목과 내용들에 대하여 정리, 기록한다.

     

    통계데이터학과는 무엇을 배우는 곳인가?

    통계데이터학과 홈페이지 학과소개에서 교육목표를 이렇게 하고 있다.

    " 데이터,인공지능 시대에 필수적인 통계학 기반 데이터과학자 및 데이터분석가의 양성"

     

    여기서 통계학, 데이터과학, 데이터분석에 대한 내용을 먼저 정리해 보자. 

    1. 통계학 [통계학개론 교재 제1장]

        데이터를 수집하고 그 데이터를 요약, 정리하여 이로부터 불확실한 사실에 대한

        결론이나 일반적인 규칙성을 이끌어내는 방법을 연구하는 학문이 통계학이다.

        1) 기술통계: 정리된 표나 그래프를 통하여 데이터의 특징을 파악하는 목적

        2) 추측통계: 표본 데이터의 일부를 분석하여 전체에 관한 추정 및 검정을 하고

                            데이터의 연관성(상관관계), 관계(회귀분석)를 모델링하여 일반화 시키는 것

    2. 데이터과학 [빅데이터의 이해와활용 교재 ]

        통계학, 해킹기술, 분야별 전문지식이 통합된 분야

        1) 해킹기술 [Wikipedia]

            컴퓨터시스템에 대한 완벽한 이해와 기술을 가지는 것을 의미하며

            프로그래밍, 네트워크, 데이터베이스, 컴퓨터시스템, 보안등의 기술을 의미한다.

    3. 데이터분석   [Wikipedia]

        데이터 분석은 유용한 정보를 발견하고, 결론을 알리고, 의사 결정을 지원하기 위해

        데이터를 검사, 정리, 변환 모델링하는 프로세스

         1) 통계적분석: 기술통계, 탐색적 데이터 분석 (EDA), 가설 확인 데이터 분석 (CDA)

         2) 데이터마이닝: 설명 목적이 아닌 예측 목적 (예측 및 분류)

         3) 비정형데이터 분석: 텍스트분석, 영상, 이미지 등

         4) 데이터 시각화

     

    개인적으로 위의 내용도 중요하지만  " 데이터, 인공지능 시대에 필수적인~ " 문장과 같이

    요즘 시대의 흐름에서 가장 중요한 학문인 통계학을 배워본다는 것이 중요한 것 같다.

         

    처음 오리엔테이션을 진행하였을 때 전공과정을 소개한 내용을 보자. (2022년버젼)

    전공교과 흐름도를 내가 생각하는 방법으로 분류해 보고 정리해 보자.

    전공교과를 7개분야로 나누어 보았으며 역시 통계학, 데이터분석이 대부분의 과정이었다.

    약간 아쉬운 것은 머신러닝프로그램 과목 신설이 무산된 것이다. (2022년 계획에서 삭제)

    보건/품질의 전문영역은 내용을 수강하지 않아 잘 모르겠다.

    1) 통계학(3): 개론, 통계학, 조사방법론

    2) 데이터분석(3): 분석도구, 데이터분석, 빅테이터/머신러닝

    3) 전문영역(1): 보건/품질

     

    통계데이터학과의 전공과목은 현재 27개과목으로 2년동안 19개과목을 이수하였다.

    [전공과목 및 이수과목 정리] : 주황색(이수), 회색(미이수), 참고수강은 타학과 및 교양

     

    통계학을 기반으로 하는 정형데이터(수치형) 분석가를 위한 과목으로 정리한다.

    ※ 머신러닝 분야는 필수 입문과목

     

    [ 수강과목 정리 : 필수 ]

    1.    R컴퓨팅 [ 3-1학기, 분석도구 ]  (필수, 모든과목의 선행학습)

          통계.데이터학과의 프로그램의 대부분은 R을 사용한다.

          순수 프로그램 내용을 학습하므로 모든 과목에 우선하여 들어야 한다.

    2.   Python과 R  [ 3-2학기, 분석도구 ]  (필수, 통계학개론과 병행 또는 후행학습)

          Python의 입문과정이다. R프로그램과 비교하여 진행한다.

          통계학개론의 기술통계, 검정, 회귀, 분산분석을 수행해 본다.

    3.   R데이터분석 [ 4-2학기, 분석도구 ] (필수, 통계학개론 후행학습)

          통계학관련 내용에 대하여 거의 전부를 R로 수행하는 과목이다.

          확률분포, 검정, 추론, 일반화선형모형 등 통계학의 내용과

          분류(판별분석, 로지스틱회귀분석, 나무모형, 서포트벡터)의 내용도 있다.

    4.   통계학개론  [ 3-1학기, 통계학 ] (필수, 모든과목의 선행학습)

          통계학에 대한 필수입문서이다. 통계관련 과목에 앞서 우선들어야 한다.

          기술통계, 확률분포, 추정, 검정, 통계비교(분산분석), 통계모형(회귀분석,상관분석) 등

          통계학의 전체내용이 잘 정리되어 있다. (개인적으로 상당히 좋은 강의자료다)

    5.   회귀모형 [ 4-1학기, 통계학 ]  (필수, 통계학개론과 병행 또는 후행학습)

          단순회귀모형, 중회귀모형, 일반화선형모형 등 회귀모형에 대한 전문과정이다.

          회귀분석은 모든 분야에서 가장 많이 사용되는 내용이다. 

    6.   실험계획과 응용 [ 3-2학기, 통계학 ]  (필수, 통계학개론 병행 또는 후행학습)

          실험계획에 의한 수치형자료에 대하여 일원배치, 이원배치, 상관분석 등

          분산분석을 수행하는 과목인 것 같다.

          나는 보건분야로 착각하여 수강하지 못하였으나 꼭 필요한 과목이라 생각한다. 

    7.   베이즈통계학 [ 4-2학기, 통계학 ] (필수, 통계학개론 후행학습)

          통계학관련 전공과목은 모두 빈도론에 기초한 내용이다.

          빈도론에 대응하는 베이즈통계학이므로 통계학의 다른 관점을 볼 수 있다.

          베이즈통계학은 빅데이터와 머신러닝분야에서 많은 발전을 하고 있다.

          통계학의 다른 관점과 현재의 발전방향을 고려하여 필수과정이라 생각된다.

    8.   다변량분석 [ 4-1학기, 데이터분석 ] (필수, 회귀분석과 병행 또는 후행학습)

          주성분분석, 인자분석, 군집분석, 다차원척도법, 상관분석, 판변분석, 로지스틱회귀분석

          나무모형 등 데이터분석의 많은 방법을 학습할 수 있다. (R,Python 병행)

    9.   데이터시각화 [ 4-1학기, 데이터분석 ] (필수)

          탐색적 자료분석, 시계열, 지리데이터, 텍스트데이터, 다변량데이터, 웹관련 시각화분석

          방법 등 데이터시각화가 데이터분석의 한 분야임을 알 수 있다.

    10. 예측방법론 [ 4-1학기, 데이터분석 ] (필수)

          시계열데이터(시간에 따라 변화하는 데이터) 의 분석 및 모형에 대한 과목이다.

          시계열데이터분석도 데이터분석의 한 분야이다.

    11. 데이터마이닝 [ 4-1학기, 데이터분석 ] (필수)

          데이터분석의 주요분야인 데이터마이닝에 대한 개론이다.

          회귀모형, 의사결정나무, 앙상블모형, 신경망모형, 모형비교평가, 군집분석의 내용이다.

    12. 딥러닝의 통계적이해 [ 4-2학기, 빅데이터 ] (필수)

          딥러닝관련 유일한 과목이다.

          딥러닝의 모형구조, 신경망모형(영상,이미지 등), 언어모형 등의 내용이다.

     

    [ 수강과목 정리 : 추천 ]

    1.  데이터과학입문 [ 3-2학기, 개론  (추천)

         데이터과학의 전반적인 개론(데이터구조,시각화,마이닝)을 소개한다.

         통계.데이터학과 입문 과목으로 추천한다.

    2.  확률의 개념과 응용 [ 3-2학기, 통계학 ]  (추천, 통계학개론과 병행 또는 후행학습)

         통계학개론의 심화과정이라 할 수 있다.

         통계학개론에서 확률과정(마코프연쇄 등), 몬테카를로 시뮬레이션(난수생성)이 추가된다.

     

    [ 수강과목 정리 : 기타(개인에 따라 선택) ]

    1.   데이터정보처리입분 [ 3-1학기, 분석도구 ]

          데이터분석의 도구를 소개한다 (한글, 엑셀, R, 파이썬)

    2.   엑셀데이터분석 [ 3-1학기, 분석도구 ] (통계학개론과 병행 또는 후행학습)

          통계학개론의 전체내용에 대하여 엑셀로 구현하는 과목이다.

          엑셀도 훌륭한 분석도구인 것을 확인할 수 있다.

          그래프의 기능과 랜덤(시뮬레이션), 프로그램의 한계는 있다.

    3.   데이터처리와 활용 [ 3-2학기, 분석도구 ]

          관계형데이터베이스(SQL)과 엑셀(VBA와 매크로)의 과목이다.

    4.   통계학의 개념과 제문제 [ 3-2학기, 통계학 ]  (통계학개론 후행학습)

          수리통계학이라 할 수 있으며 통계학의 수학적 개념과 증명에 대한 과목이다.

    5  . 빅데이터의 이해 [ 4-2학기, 빅데이터 ] 

          빅데이터에 대한 개요, 시각화, 텍스트빅데이터 등 개론과목이다.

    6  . 비정형데이터분석 [ 4-2학기, 빅데이터 ] 

          비정형 데이터 중에서 텍스트데이터의 자료수집,분석에 대한 내용이다.

    7.   대학수학의 이해 [ 3-2학기 ]

          미분, 적분, 행렬, 수열등의 내용이 있다.

          개인적으로 통계학개론 수준의 개념을 알려고 할때는 꼭 필요하다고 볼 수 없다.

          ※ 필요하면 미분,적분, 행렬에 대한 집중학습을 하면 될 것 같다.

    8.   머신러닝(컴퓨터학과) [ 4-2학기 ]

          머신러닝이란 제목으로 교과과정에 있는 것은 이것이 유일하다.(2022년 신설)

          데이터통계학과의 다변량분석, 데이터마이닝, 딥러닝의 통계적이해의 내용들과

          거의 동일한 내용이며, 코딩 실습은 하지 않는다.

          

    [ 통계데이터학과의 요약 ]

      1. 통계학분야는 이론 및 컴퓨터프로그래밍(R,Python)으로 수행할 수 있다.

          ※ R이 대표적으로 사용되며 Python은 현재 병행으로 사용되는 과목도 있다.

      2. 데이터분석은 분석방법을 모두 수강할 수 있다.

      3. 머신러닝부분은 현재까지는 개론적 성격이 많은 것 같다.

          ※ 분류 또는 학습방법에 대한 자세한 코딩과 실습이 아쉽다.

      4. 데이터과학의 해킹기술에 해당하는 분야는 컴퓨터학과 전공과목을 봐야한다.

     

    [ 통계학 기반의 데이터분석가 양성 (가능) , 데이터과학자 (컴퓨터학과 일부과목 병행) ]

Designed by Tistory.